Logistisk multilevel analyse i Stata

Skrevet d. 14.05.2009 af Liw

Hej alle

Jeg sidder og kÃ¦mper lidt med en logistisk multilevel analyse. Min afhÃ¦ngige variabel er dikotom og jeg har uafhÃ¦ngige variable pÃ¥ 2 niveauer - fem pÃ¥ hvert. Variablene er enten dikotome eller (tilnÃ¦rmelsesvist) intervalskalerede.
Jeg har kun anvendt SPSS tidligere, men da dette ikke kan bruges til denne analyse, er jeg gÃ¥et i gang med at lÃ¦re Stata bedre at kende. Jeg synes dog det er svÃ¦rt at vurdere hvilken en af de mange kommandoer der egner sig bedst til formÃ¥let.
Kan nogen hjÃ¦lpe?

PÃ¥ forhÃ¥nd mange tak!

Skrevet d. 14.05.2009 af KristianKarlson

Hej,

Det kommer an pÃ¥, om du kan nÃ¸jes med at lave random intercept modeller eller ogsÃ¥ skal lave random slope modeller.

Hvis du kan skal lave random intercept modeller, sÃ¥ kig pÃ¥ -xtlogit-. Det er en fantastisk kommando, isÃ¦r fordi den afrapporterer Intra Class Correlation direkte, hvilket letter arbejdet en del. Husk at sÃ¦tte din niveau-2-variabel med -xtset-, hvis du vil bruge -xtlogit-.

Ved random slope modeller skal du bruge -xtmelogit-, som er lidt mere tricky (kommandoen kÃ¸rer som -xtmixed-). Det tager i hvert fald lidt tid at lÃ¦re den at kende, men sÃ¥ snart at den er der, er den ogsÃ¥ nem at arbejde med.

Der findes en rigtig god bog om multilevel-analyse i Stata af Rabe-Hesketh og Skrondal (http://www.stata.com/bookstore/mlmus.html). Den er rigtig god som hÃ¥ndbog til kommandoerne, og der vist lige kommet en udgave til Stata 10.

Nu ved jeg ikke, hvordan din afhÃ¦ngige variabel fordeler sig (dvs. andelen af 0`er og 1`er), men hvis den er fordelt meget omkring 50/50 procent vil jeg overveje at bruge lineÃ¦r multilevel regression. Men det er selvfÃ¸lgelig blot et forslag - jeg synes i hvert fald bare, at den lineÃ¦re udgave er nemmere at tolke pÃ¥. Men igen, hvis du skal bruge logistisk multilevel-analyse, sÃ¥ skal du bare kaste dig ud i det ;)

vh Kristian

Skrevet d. 15.05.2009 af Liw

Hej Kristian

Tak for dit rigtig gode svar. Jeg troede ikke, at lineÃ¦r multilevel regression var hensigtsmÃ¦ssig, nÃ¥r den afhÃ¦ngige er dikotom.
Den afhÃ¦ngige variabel fordeler sig meget skÃ¦vt - 21/724 - men da der er tale om populationsdata har det vel ikke nogen betydning?

Hvis det skal vÃ¦re logistisk regression, vil jeg tage xtlogit, som du foreslÃ¥r.

Tusind tak for dine tips!

Mvh Line

Skrevet d. 15.05.2009 af Mads_Jaeger

Hej Line

Kristians forslag om at bruge en lineÃ¦r model i stedet for en logistisk gÃ¥r pÃ¥ (tror jeg!), at den lineÃ¦re model er nemmere at estimere og fortolke. Hvis du har en ca 50/50 fordeling af 0/1`ere gÃ¸r det ikke sÃ¥ meget, at du bruger den lineÃ¦re model selv om den afhÃ¦ngige variabel er binÃ¦r. Men i dit tilfÃ¦lde med en meget skÃ¦v fordeling er det nok smartest at bruge den logistiske model.

xtlogit og xtmelogit er begge rigtig gode kommandoer og nemme at bruge. Sig til hvis du fÃ¥r brug for hjÃ¦lp

Mads

Skrevet d. 15.05.2009 af Liw

Hej igen

Mange tak for jeres svar og det gode tilbud om hjÃ¦lp! Det vil jeg sikkert benytte mig af senere!

Mvh Line

Skrevet d. 18.05.2009 af Liw

Hej igen

Jeg troede lige, jeg havde fundet ud af det... Men jeg har problemer med bÃ¥de xtset og xtlogit. I fÃ¥r lige en grundig beskrivelse.

UndersÃ¸gelsen: "Hvilke faktorer er afgÃ¸rende for, om en kandidat sprÃ¦nger listen til Europa-Parlamentsvalg?"

DatasÃ¦ttet: Indeholder hele populationen. BestÃ¥r af 685 obervationer/kandidater. Variablene er pÃ¥ to niveauer: Partiniveau og kandidatniveau. Observationerne er afhÃ¦ngige af hinanden ift. parti og opstillingsÃ¥r (som er hvert femte Ã¥r: 79, 84, 89, 94, 99 og 04).
Den afhÃ¦ngige variabel fordeler sig meget skÃ¦vt: 21 "listespringere" mod 664 "ikke-listespringere".

Jeg Ã¸nsker at beregne odds ratio og forklaret varians for begge niveauer. Jeg Ã¸nsker signifikanstest pÃ¥ 0,90-niveau.

Jeg har brugt xtset til at definere mine niveau-2-variable, men nÃ¥r jeg skriver "xtset Parti Opstaar" svarer den: repeated time values within panel
r(451);
Jeg har sÃ¥ prÃ¸vet at skrive det hver for sig ("xtset Parti" og "xtset Opstaar"), men ved ikke om det fungerer?

Derefter har jeg forsÃ¸gt at kÃ¸re analysen med "xtlogit [afhÃ¦ngig variabel] [9 uafhÃ¦ngige variable]
og fÃ¥r fejlmeddelelsen: number of quadrature points must be less than or equal to number of obs
r(198);

Kan nogen af jer se, hvad jeg har gjort galt?

Mange hilsner
Line

Skrevet d. 18.05.2009 af Liw

Hej igen-igen

Nu har jeg fÃ¥et lÃ¸st den ene del af problemet - det var fordi nogle af variablene var markeret som "strings" i stedet for numeriske... Lidt nybegynder-agtigt :)

Jeg har dog stadig problemet med xtset - hvad gÃ¸r jeg, nÃ¥r jeg gerne bÃ¥de vil have defineret mit level 2-niveau som parti og opstillingsÃ¥r?

Mange hilsner
Line

Skrevet d. 19.05.2009 af KristianKarlson

Hej Line,

Du skal kun angive din niveau-2 variabel i xtset. Jeg giver lige et eksempel pÃ¥ en kommando.

Variable:

parti: identificerer din niveau-2 variabel (parti)
y: afhÃ¦ngig binÃ¦r variabel
x: kandidat-specifikke variable
z: parti-specifikke variable

KÃ¸r fÃ¸lgende to kommandoer:

xtset parti
xtlogit y x z

Den fÃ¸rste kommando sÃ¦tter parti som niveau-2-id-variabel, mens den anden kommando kÃ¸rer den logistiske multilevel regression. Jeg ved ikke, om du bÃ¥de har kandidat-specifikke og parti-specifikke variable, men pointen er, at x og z stÃ¥r for "forklarende variable". xtlogit tager selv hÃ¸jde for, hvilket niveau de befinder sig pÃ¥.

Og sÃ¥ lige en anden ting, som jeg tror, det er rart at vide: I logistisk regression estimerer man ikke nogen niveau-1-varians, fordi logistisk regression antager denne til at have en fast vÃ¦rdi. Faktisk er den (pi^2)/3 ca. = 3.29. Imidlertid har niveau-2-variansen prÃ¦cis samme fortolkning som i lineÃ¦r multilevel-analyse.

NÃ¥r xtlogit udregner ICC for dig (rho kalder Stata det), sÃ¥ regner den den i virkeligheden ud fra ovenstÃ¥ende niveau-1-varians (altid = 3.29) og den estimerede niveau-2-varians. Det er en "approksimation" til den ICC, du kender i den lineÃ¦re multilevel-analyse, men samme fortolkning gÃ¦lder, altsÃ¥ noget med andelen af niveau-2 variation i din afhÃ¦ngige variabel.

Jeg hÃ¥ber det hjÃ¦lper.

mvh Kristian

Skrevet d. 20.05.2009 af Liw

Tusind tak! Det var meget brugbart! Virkelig fedt at fÃ¥ sÃ¥ hurtig og god respons. Nu har jeg ogsÃ¥ nÃ¦sten lÃ¸st problemerne, men har bare et lille spÃ¸rgsmÃ¥l mere:

Selvom mine observationer er afhÃ¦ngige bÃ¥de i forhold til parti og Ã¥ret hvor de er opstillet (Venstres kandidater i 1979 er jo ikke afhÃ¦ngige af Venstres kandidater i 2004), skal jeg kun xtset`te i forhold til parti?
Jeg fÃ¥r i hvert fald fejlmeddelelsen "repeated time values within panel
r(451);" nÃ¥r jeg skriver kommandoen:

xtset Parti Opstillingsaar

Mange hilsner
Line

Skrevet d. 20.05.2009 af KristianKarlson

Hej Line,

Det var sÃ¥ lidt ;)

Jeg er ikke helt med pÃ¥, hvad dit andet problem er, men here goes. Du har 3 niveauer? kandidat > parti > opstillingsÃ¥r? I sÃ¥ fald skal du bruge xtmelogit, fx

xtmelogit y x1 x2 || Parti: || Opstillingsaar: , mle var

BemÃ¦rk, at det godt kan vÃ¦re, at du skal bytte om pÃ¥ Parti og Opstillingsaar - jeg kan ikke huske, hvordan Stata vil have dem.

BemÃ¦rk, at hvis du kun har fÃ¥ opstillingsÃ¥r, sÃ¥ inkludÃ©r dem som dummy-variable i hovedlingingen (dvs. som x`er) i stedet.

vh Kristian

Skrevet d. 21.05.2009 af Liw

Hej Kristian

Tak for dine svar. Jeg er nu hjulpet rigtig godt pÃ¥ vej og mÃ¥ bare i gang med fortolkningen.

Igen - tusind tak. Det er virkelig guld vÃ¦rd at kunne fÃ¥ hjÃ¦lp herinde.

Hav det godt!

Mange hilsner
Line

Logistisk multilevel analyse i Stata

Andre læser også