Sociologiskforum.dk var aktivt fra 2004-2012, men eksisterer i dag kun som arkiv.
Sociologiskforum.dk

Modelkontrol i xtmelogit

Skrevet d. 13.03.2011 af JeppeHamming
Hejsa Jeg er i gang med at arbjede med et større paneldatasæt, hvor jeg bruger xtmelogit i STATA til at lave logistisk modelsøgning på en række afhængige variable. Jeg er her nået frem til nogle slutmodeller, som jeg gerne vil validere med andre metoder end -2loglikelihood-statistikken og signifikanstest af parameterestimaterne. Jeg kunne eksempelvis godt tænke mig at lave en Hosmer-Lemeshow test, men jeg kan ikke finde frem til en måde at få STATA til at lave den for mig på mine slutmodeller.Er der nogen, der ved, hvordan jeg gør det? Derudover kunne jeg godt tænke mig at lave noget residualanalyse. Her har jeg brugt predict til at få min estimerede sandsynlighed for succes på min afhængige variable. Her kan jeg også producere en variable med den standardiserede afvigelse fra det liniære logistiske udtryk, der ligger bag min model med predict ,stdp. Men jeg er i tvivl om, hvordan jeg tester disse værdier på en fornuftig og overskuelig måde. Jeg kan plotte dem mod en normalfordeling, men jeg kunne godt tænke mig en metode til at producere et estimat for, hvorvidt fejlledet er usystematisk i forhold til mine uafhængige varialble. Så jeg håber på, at der er nogen, der har et godt foreslag til det?
Skrevet d. 17.03.2011 af KristianKarlson
Hej Jeppe Gode spørgsmål. Efter xtmelogit kan du køre postestimationskommandoen -predict-. Hvis du vil have den forudsagte sandsynlighed, så gør følgende: predict p, mu Nu har du variablen p, og du må dermed kunne lave en decil-opdeling og så lave et Hosmer-Lemeshow-test selv. Dette test sammenligner de observerede med de forventede i fx deciler (10 kategorier). Hvis du smider tabellen med de observerede og forventede værdier for ind i Excel, så kan du hurtigt regne en chi2-værdi ud. Måske er der en guide på nettet et sted (fx på Statalist). [Det svarer til, hvad Stata gør efter logit-kommandoen, når man skriver: estat gof, table group(10)]. Herudover kan du studere residualerne ved følgende kommando. predict e, pearson zscore e (Hvis du kun vil have niveau-1 residualet, så skriv: predict e, pearson fixedonly). Disse standardiserede residualer kan du studere grupperet, fx table x, c(mean z_e) Hvor x er en diskret variabel, du vil studere de standardiserede "grupperede" residualer over. Håber det giver mening! mvh Kristian
Skrevet d. 18.03.2011 af JeppeHamming
Tak for svaret Kristian, det er rigtig brugbart. jeg havde selvfølgelig håbet, at STATA kunne lave mine Hosmer-Lemeshow test for mig, det havde været dejlig let, men din tilgang ser også ret tilgængelig ud. Jeg kan ikke finde dokumentationen på predict med option=person - hvad er det for nogle residualer jeg får ud med den kommando? og hvad kan jeg antage om dem. De skal selvfølgelig ikke gerne være afhængige af min forklarende variabel, men kan jeg lave en form for test af, hvorvidt en evt. korrelation mellem et residual opnået som beskrevet og min forklarende variabel er så stærk, at min model skal korrigeres?
Skrevet d. 19.03.2011 af KristianKarlson
Optionen pearson er så vidt jeg ved afvigelsen mellem den observerede værdi (0 eller 1) og den forudsagte sandsynlighed. Man antager som sådan ikke noget om disse residualer i en logistisk regressionsmodel. Men du kan standardisere dem og gruppere dem og så se, om de standardiserede grupperede residualer er større eller mindre end +-1,96. Ang. korrelationen med dine forklarende variable: Residualet og de forklarende variable er per definition ukorrelerede. Ellers kan man ikke estimere modellen. Så det behøver du ikke at teste.