Analisi a Gruppi Multipli nella Modellizzazione a Equazioni Strutturali

'Multiple Group Analysis in Structural Equation Modeling.'

Verifica degli effetti tra le sotto-popolazioni

L’analisi a gruppi multipli (MGA) è una tecnica statistica che consente ai ricercatori di investigare le differenze tra le sotto-popolazioni, o segmenti demografici, abilitando la specifica di modelli di equazioni strutturali (SEMs) con stime specifiche per gruppo o con stime uguali tra i gruppi.

Le differenze tra le medie, le regressioni, i carichi, le varianze e le covarianze delle variabili possono essere indagate utilizzando l’MGA, poiché tutti questi parametri possono essere modellati in SEM. Pertanto, anche se altre tecniche di modellizzazione (ad esempio, analisi della varianza o regressione con effetti di interazione) rendono possibile investigare il ruolo di una variabile di raggruppamento, queste tecniche sono meno flessibili dell’MGA in SEM.

Figura 1. Panoramica generale dell’analisi a gruppi multipli e della strategia per fare inferenze. Immagine dell’autore.

Usi comuni dell’analisi a gruppi multipli

Ogni volta che c’è l’interesse di esplorare le differenze tra i gruppi, l’MGA può essere uno strumento utile. Quando i dati sono raccolti su individui, i gruppi sono definiti principalmente in base a fattori con pochi livelli (ad esempio, genere, etnia, occupazione, stato familiare, stato di salute, ecc.), ma possono anche essere definiti in base a una varietà di altri fattori a seconda del campo, dei dati e del contesto analitico. Alcuni esempi di domande a cui l’MGA può rispondere in diversi campi sono:

Ricerca di mercato

La soddisfazione del prodotto (o la qualità) è diversa tra i segmenti demografici?

Analisi delle persone

La performance dei dipendenti (o la motivazione) è uguale tra le filiali o le divisioni dell’azienda?

Cura della salute

Le valutazioni riportate dai pazienti differiscono in base al produttore del farmaco?

Marketing

La nuova campagna di marketing è efficace nell’aumentare la reputazione del marchio in diverse aree geografiche?

Psicologia

Ci sono differenze interculturali nell’esperienza emotiva?

Educazione

La crescita del rendimento accademico è uguale per femmine e maschi?

Misurazione di variabili non osservate in gruppi multipli

Tutte le domande elencate sopra riguardano variabili che non sono osservate direttamente (ad esempio, soddisfazione, performance, ecc.), anche note come variabili latenti. Poiché queste variabili non possono essere osservate direttamente, sono difficili da misurare.

Figura 2. Confronto tra la misurazione di variabili non osservate (latenti) e di variabili osservate. Immagine dell’autore.

Una di queste difficoltà è che i diversi gruppi possono avere diverse concettualizzazioni di queste variabili. Chiediti:

Cos’è la soddisfazione?

Cos’è una buona performance?

È probabile che le tue risposte a queste domande siano diverse da quelle di persone con diverse esperienze di vita?

Molte volte, la risposta è sì.

Felizmente, possiamo testare empiricamente se i diversi gruppi concettualizzano variabili latenti in modo simile. Questo test viene effettuato con l’MGA nel quadro SEM ed è noto come invarianza fattoriale (alias invarianza di misura). I test di invarianza fattoriale sono fondamentali per garantire che le comparazioni tra i gruppi siano valide; pertanto, questi test devono essere effettuati prima di confrontare le regressioni o le medie tra i gruppi (alias parametri strutturali) se ci sono variabili latenti.

Figura 3. La sfida della modellizzazione di variabili non osservate è che potrebbero non misurare la stessa cosa tra le sotto-popolazioni. Immagine dell’autore.

Testare le differenze nei parametri

Per testare le differenze nei parametri tra i gruppi, i ricercatori di solito adattano SEM con e senza vincoli di uguaglianza tra i gruppi. Quindi, i due modelli risultanti sono confrontati utilizzando un test di rapporto di verosimiglianza (equivalentemente, un test di differenza del chi-quadrato) e le differenze in altre statistiche di adattamento (ad esempio, l’indice di adattamento comparativo e l’errore quadratico medio di approssimazione) per valutare se l’imposizione di vincoli produce un peggioramento statisticamente significativo del modello di adattamento. Se l’adattamento del modello non peggiora significativamente, allora viene mantenuto il modello con i vincoli di uguaglianza, e si conclude che le popolazioni prese in considerazione non differiscono significativamente dal parametro(i) testato(i). Al contrario, se l’adattamento del modello peggiora significativamente, viene mantenuto il modello senza vincoli (cioè, in cui ogni gruppo ha la propria stima(e)), e si conclude che le popolazioni prese in considerazione differiscono significativamente dal parametro(i) testato(i).

La figura qui sotto illustra la strategia dietro MGA in un esempio a due gruppi in cui viene fatta una semplice regressione lineare. Questa figura mostra i vincoli di uguaglianza posti su un parametro. Il Modello 1 ha zero gradi di libertà (cioè è completamente saturato), mentre il Modello 2 ha un grado di libertà risultante dal vincolo di uguaglianza. Questi modelli vengono confrontati sulla base della differenza dei loro chi-quadrati, che è anche distribuita come chi-quadrato con gradi di libertà pari a uno (la differenza tra i gradi di libertà tra i modelli). Un test meno specifico può essere condotto ponendo contemporaneamente vincoli di uguaglianza su più parametri.

Figura 4. Strategia dietro MGA in un esempio a due gruppi con una semplice regressione lineare. Immagine dell’autore.

Le SEM sono state sviluppate come modelli confermativi. Cioè, si formulano ipotesi, si traducono in un modello statistico testabile e le inferenze vengono utilizzate per determinare se i dati supportano le ipotesi. Questo approccio è anche applicato in MGA ed è fondamentale per evitare grandi tassi di errore di tipo I, che portano a trovare effetti statistici non realmente presenti nella popolazione (i) di studio. Per questa ragione, non è consigliabile condurre tutte le possibili comparazioni tra gruppi.

Intuizione dietro l’estimazione di MGA

Attenzione: I paragrafi di seguito sono rivolti ai metodologi che desiderano approfondire la loro comprensione di MGA. Questa sezione assume che i lettori comprendano l’estimatore di massima verosimiglianza a informazione completa. Inoltre, i passaggi descritti qui sono solo per spiegare la logica dietro MGA. In realtà, condurre MGA con questi passaggi sarebbe inefficiente perché il software statistico dovrebbe utilizzare algoritmi che semplificano questo processo.

L’estimazione di MGA non è diversa da quella di una SEM semplice con dati mancanti. In una implementazione standard di MGA-SEM, gli utenti inviano i dati che vogliono analizzare insieme a una variabile di raggruppamento, che indica il gruppo a cui appartiene ciascuna osservazione. È richiesto un semplice passaggio di manipolazione dei dati, utilizzando la variabile di raggruppamento, per configurare l’analisi per i gruppi multipli. La figura qui sotto illustra i dati forniti per l’analisi e la ristrutturazione dei dati per MGA.

Figura 5. Dati inseriti dagli utenti e dati dopo la ristrutturazione per eseguire l’analisi a gruppi multipli. Immagine dell’autore.

I dati risultanti possono essere utilizzati con la massima verosimiglianza a informazione completa come stimatore per assicurare che tutte le righe dei dati siano inviate per l’analisi nonostante ci siano dati mancanti. Alcuni risultati comodi dai dati ristrutturati sono:

La log-verosimiglianza di ogni riga è influenzata solo dalle celle non mancanti, in modo tale che l’aggiunta della log-verosimiglianza di tutte le righe “Gruppo 0” dia la log-verosimiglianza per quel gruppo. Allo stesso modo, l’aggiunta della log-verosimiglianza di tutte le righe “Gruppo 1” fornisce la log-verosimiglianza per il gruppo 1. La log-verosimiglianza di ciascun gruppo viene utilizzata per stimare una statistica chi-quadrato per il modello complessivo, che quantifica l’inadeguatezza per ciascun gruppo.
Il modello di dati mancanti impedisce la stima di qualsiasi parametro tra le variabili dei gruppi (ad esempio, la covarianza di Var1_0 e Var1_1 non è stimabile), il che è inconseguenziale perché MGA si occupa della comparazione degli effetti tra i gruppi anziché delle stime tra i gruppi.
La “SEM standard” consente di impostare vincoli di uguaglianza sui parametri. Pertanto, utilizzando i dati ristrutturati in SEM, è possibile specificare due modelli identici con il sottoinsieme di variabili di ciascun gruppo e i vincoli di uguaglianza possono essere posti sui parametri equivalenti tra i gruppi. Per ribadire, tutto ciò può essere fatto nella SEM standard senza chiedere esplicitamente al software di condurre MGA.

Felizmente, questi passi non devono essere eseguiti dagli utenti che desiderano eseguire MGA-SEM! Il software SEM rende molto semplice l’adattamento di modelli a gruppi multipli permettendo agli utenti di specificare una variabile di raggruppamento. Tuttavia, effettuando la manipolazione dei dati (Figura 5) e utilizzando SEM standard per condurre MGA-SEM approfondirà la comprensione di questo argomento. Per saperne di più, consulta le risorse citate di seguito.

Esempio passo-passo di analisi a gruppi multipli applicata in JMP.

Capitolo di libro sull’analisi a gruppi multipli per l’invarianza fattoriale (di misurazione):

Widaman, K. F., & Olivera-Aguilar, M. (2022). Investigating measurement invariance using confirmatory factor analysis. Handbook of Structural Equation Modeling , 367.

Articolo di giornale sull’utilizzo di indici di adattamento alternativi per testare l’invarianza:

Chen, F. F. (2007). Sensibilità degli indici di bontà di adattamento alla mancanza di invarianza di misurazione. Modellazione di equazioni strutturali: una rivista multidisciplinare, 14 (3), 464-504.

Questo articolo è stato originariamente pubblicato nella comunità degli utenti JMP il 27 febbraio 2023.

Causal Inference,data science,Statistics,Structural Equation Model,Thoughts And Theory

Analisi a Gruppi Multipli nella Modellizzazione a Equazioni Strutturali

'Multiple Group Analysis in Structural Equation Modeling.'

Verifica degli effetti tra le sotto-popolazioni

Usi comuni dell’analisi a gruppi multipli

Misurazione di variabili non osservate in gruppi multipli

Testare le differenze nei parametri

Intuizione dietro l’estimazione di MGA

Diciamolo una volta sola! Ripetere le parole non aiuta l’AI.

Svelando gli effetti dannosi dell’Intelligenza Artificiale sulla comunità transessuale.

5 Segnali Che La Tua Dati Siano Modellati Male

La guida essenziale dell’analisi espl...

Serie AI Frontiers Risorse Umane

Grafici a ragnatela e paralleli in R con il...

Prevedere il successo di un programma di ri...

Come prevedere la perdita di giocatori, con...

Scienza dei dati