MCA i SPAD og datavægt

Jeg er i gang med en SMCA i SPAD på et datasæt fra en folkesundhedsundersøgelse med knap 29.000 respondenter efter rensning. Danmarks Statistik har udarbejdet to vægte til datasættet, henholdsvis til stikprøven og populationen, og der vægtes for en række baggrundsfaktorer.

Jeg udarbejder et rum for sundhedsadfærd og anvender sociale baggrundsfaktorer som supplementære variable, da sundhedsadfærden er mest udtømmende beskrevet gennem variablene i datasættet.
I virkeligheden ville jeg helst vægte til populationen, da min analysen dermed i et vist omfang kan sammenlignes direkte med/udbygge de øvrige analyser på datamaterialet, men når jeg kører analysen med denne får samtlige supplementære variable koordinater på 0-0,02, eller de `falder ind på midten af kortet`. (de aktive modaliteter er fint spredt)
Med vægten til stikprøven og uden vægt er der lidt større spredning af supplementærpunkterne, men stadig ikke sådan `rigtig meget`.

Analyserne med og uden vægte giver samme resultater, bortset fra at samtlige modaliteter på en enkelt akse får modsat fortegn - så i virkeligheden er der ikke noget i vejen for at fortsætte uden vægt, men jeg er blevet nysgerrig over, hvad det er, der sker, når vægten anvendes: Det er efterhånden ret bred enighed om social ulighed i sundhed og sundhedsadfærd, så det undrer mig at forskellene ikke bliver større. Kan det have noget med datasættets størrelse at gøre? (Jeg får samme resultat som uden og med stikprøvevægt hvis jeg analyserer på 10% af respondenterne)

Nogen der har erfaring med noget lignende?

Andre læser også