Empty Use: setheader(no|en,rooturl,roottopic,subtopic,emailcontact,telephone)

12.1.1 Enveis variansanalyse. Eksempel: lowbwt.sav

Vi skal nå sammenligne de de fire gruppene i LWTKGO med hensyn til fødselsvekt (BWT). Siden ANOVA baserer seg på antagelsen om normalfordeling i de gruppene vi skal sammenligne, må vi først lage normalfordelingsplott for BWT i de fire gruppene til LWTKGO. Dette gjør vi via Analyze/Descriptive Statistics/Explore. Vi trekker BWT over i Dependent List og LWTKGO over i Factor List. Vi går så inn i Plots, der vi klikker av på Normality plots with tests. Da ser dialogboksen vår slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1a.jpg

Ved å klikke på Continue og OK, får vi følgende resultat. Her gjengir vi bare selve normalfordelingsplottene.

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1b.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1c.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1d.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1e.jpg

Vi ser at helhetsbildet er at dataene i alle gruppene er normalfordelte. Det er noen få avvik i venstre hale i gruppene som er lagd av andre, tredje og fjerde kvartil for LWTKG. Vi går derfor videre med antagelsen om at dataene er normalfordelte.

Da skal vi kjøre en variansanalyse for BWT med hensyn til LWTKGO. Vi går inn i Analyze/Compare Means/One-Way ANOVA. Der trekker vi BWT over i vinduet med Dependent List og LWTKGO over i Factor. Da ser dialogboksen vår slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1f.jpg

Vi klikker på OK og får det følgende:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1g.jpg

Dette gir oss en oversikt over hvordan variasjonen fordeler seg mellom og innen gruppene. Vi ser at variasjonen mellom grupper er stor i forhold til den innen grupper. P-verdien i kolonnen lengst til høyre, sier oss om variasjonen mellom grupper er statistisk signifikant. Siden p = 0.008, som er mye mindre enn 0.05, er det klart at det er signifikant forskjell mellom gruppene.

Spørsmålet er nå om mellom hvilke grupper det er forskjell. Da må vi gjøre separate t-tester fo å avgjøre dette. Vi trenger egentlig bare å gjøre tre separate t-tester. Hvis vi velger laveste kategori som våre referansekategori, som her betyr at vi velger første kvartil som referanse, trenger vi bare å gjøre tre sammenligninger: Annen kvartil mot første kvartil, tredje kvartil mot første kvartil og fjerde kvartil mot første kvartil. Vi skal se hvordan vi gjør dette. Siden det er flere t-tester som er ganske like, velger vi å bruke en ordrefil få å gjøre dette enkelt for oss selv.

Vi starter da med en t-test mellom første og annen kvartil. Da går vi inn i Analyze/Compare means/Independett-Samples T-test. Her trekker vi over BWT i Test Variable(s) og LWTKGO i Grouping Variable. Da åpner det seg en Define Groups knapp som vi klikker på. Her skriver vi inn 1 og 2 i de vinduene. Da går vi tilbake til den forrige dialogboksen ved å klikke på OK. Men nå klikker vi på Paste. Da åpner det seg et ordrevindu som ser slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1h.jpg

Nå kan vi gjøre alle analysene samtidig ved å utvide ordrefilen vår. Vi legger til

T-TEST GROUPS=lwtkgo(1 3)
/MISSING=ANALYSIS
/VARIABLES=bwt
/CRITERIA=CI(.95).
T-TEST GROUPS=lwtkgo(1 4)
/MISSING=ANALYSIS
/VARIABLES=bwt
/CRITERIA=CI(.95).

bare ved å endre første linje i hver analyse, slik at vi også får sammenlignet gruppe 1 og gruppe 3, og gruppe 1 og gruppe 4. Da ser ordrefilen våre slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1i.jpg

Da markerer vi alle linjene i denne filen og klikker på den grønne pilen i knappelinjen på toppen av filen. Da får vi følgende resultat:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1j.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1k.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1l.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1m.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1n.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1o.jpg

Vi ser at tabellene er ganske like. Det er en vektøkning på barna på omtrent 400 gram når mors vekt øker fra første kvartil til enten annen, tredje eller fjerde kvartil. Vi ser at spredningene i alle gruppene er omtrent like store, og Levenes test har p-verdier som alle er lang over 0.05. Altså kan vi anta at variansene er like store, og sammenligningene mellom fødselsvektene kan vi lese fra første linje i utskriften for Independent Samples Test. Vi finner at alle p-verdiene er klart mindre enn 0.05.

Merk at alle differansene i fødselsvekt er negative, siden vi tar differansen mellom fødselsvekt i første kvartil og i de andre kvartilene. Fødselsvektene i annen, tredje og fjerde kvartil er høyere enn i første kvartil. Når vi skal presentere resultatene, kan der være naturlig å snu om fra negative til positive tall. Når vi for eksempel skal presentere tallene for sammenligningen mellom første og annen kvartil, har vi at forskjellen i fødselsvekt er 382 gram, med et konfidensintervall på (119, 646) og en p-verdi på 0.005.

Dersom vi vil sammenligne fødselsvekten mellom annen, tredje og fjerde kvartil kan vi bare endre verdien i ordrefilen vi nå har lagd. Vi finner at det ikke er statistisk signifikant forskjell i fødselsvekt mellom noen av gruppene. Dersom vi kjører en analyse mellom annen og fjerde kvartil finner vi følgende:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1p.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1q.jpg

Vi ser at forskjellen i fødselsvekt i annen og fjerde kvartil er 20 gram. Det er gode grunner til å lese resultatene for sammenligningen fra øverste linje i utskriften for t-testen. Da finner vi at konfidensintervallet er (-287, 327). Husk at vi her IKKE behøver snu konfidensintervallet, siden vi har en positiv forskjell i differansen mellom gruppene.

Vi gjør deretter en varariansanalyse for sammenhengen mellom BWT og RACE. Pass på at det fortsatt er datafilen lowbwt.sav som er vår aktive datafil. Først må vi sjekke at BWT- dataene er normalfordelte for de tre kategoriene av RACE. Vi viser ikke normalfordelingsplottene her, men konkluderer bare med at det er gode grunner til å anta at dataene er normalfordelte.Vi setter bare opp selve ordrene, som kopieres inn i en ordrefil, og som kjøres ved å markeres og så klikke på den grønne pilen. Merk at vi her i t-testen bare sammenligner black (RACE = 2) mot white ( RACE = 1) og other (RACE = 3) mot white (RACE = 1). Ordrene som vi skal kjøre er:

ONEWAY bwt BY race
/MISSING ANALYSIS.
T-TEST GROUPS=race(1 2)
/MISSING=ANALYSIS
/VARIABLES=bwt
/CRITERIA=CI(.95).
T-TEST GROUPS=race(1 3)
/MISSING=ANALYSIS
/VARIABLES=bwt
/CRITERIA=CI(.95).

Da blir resultatene:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1r.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1s.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1t.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1u.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/25.1v.jpg

Av den første tabellen ser vi at det er en signifikant forskjell mellom de tre kategoriene av RACE med hensyn til fødselsvekt BWT. Dette ser vi av p-verdien, som her er p = 0.008. Da er spørsmålet om det er forskjell mellom white og black, og mellom white og other. I den føste av t-testene ser vi differansen i fødselsvekt er 384 gram. Et 95% konfidensintervall er (73.2, 694.9) og p-verdien er 0.016. Merk at 0 ligger utenfor konfidensintervallet, slik at vi bare ved å se på kan si at p-verdien må være < 0.05. Siden Levenes test viser en p-verdi på 0.367, kan vi lese av resultatene i øverste linje.

Tilsvarende finner vi at forskjellen i fødselsvekt mellom white og black er på 299 gram, med et 95% konfidensintervall på (71.8, 527.7). P-verdien er p = 0.010. Altså statistisk signifikant forskjell også i fødselsvekt mellom barna til white og other mødre.