12.2.2 Multippel regresjon. Eksempel: lowbwt.sav
Nå har vi gjort alle de enkle lineære analysene som vi må for å kunne vurdere effekten i forhold til den avhengige variabelen BWT. Ikke alle effektene var statistisk signifikante, men alle p-verdiene var < 0.20. I henhold til punkt 2 i oversikten i innledningen til dette kapittelet tar med alle variablene inn i en multippel regresjonsanalyse.
Da går vi igjen til Analyze/Regression/Linear. Vi trekker nå over LWTKG, AGE, SMOKE, RACE2, RACE3, HT, PTLD og FTVD over i Independent. Da ser dialogboksen vår slik ut:
Når vi klikker på OK, får vi følgende resultat.
Vi ser at alle disse variablene samlet sett forklarer 19.7% av variasjonen i BWT. Nå begynner det å bli bra!
Når vi går til neste tabell ser vi at AGE og FTVD ikke er statistisk signifikante. AGE har en p-verdi på 0.926 og FTVD på 0.668. Etter regelen i punkt 3 skal vi nå ta ut begge disse variablene. Men vi har bestemt oss for at AGE er så viktig at vi lar den være med i den videre analysen. Men vi tar nå ut FTVD av listen i Independent. Når vi klikker på OK får vi følgende resultat:
Vi ser at r2 = 0 0197 som betyr at alle disse forklaringsvariableen samlet sett forklarer 19.7% av variasjonen i BWT. Ikke dårlig!
Vi ser at alle variablene (med unntak av AGE som vi likevel vil ha med) er statistisk signifikante. Effekten av hver forklaringsvariabel må nå tolkes som effekten av den forklaringsvariabelen når vi kontrollerer for (dvs. tar bort) effekten av de andre forklaringsvariablene. Altså er effekten av røyking (SMOKE) at fødselsvekten reduseres med 339.4 gram (p = 0.002, 95% KI = (123.7, 555)) når vi kontrollerer for effekten av alle de andre forklaringsvariablene. Tilsvarende er effekten av mors vekt at en vektøkning på 1 kg for mor, betyr at barnets fødselsvekt øker med 10.3 gram (p = 0.009, 95% KI = (2.6, 18.0). Slik kan vi forklare alle variablene som nå har vist seg å være viktige for forklaringen av fødselsvekt.