Empty Use: setheader(no|en,rooturl,roottopic,subtopic,emailcontact,telephone)

12.3.1 Enkel logistisk regresjon. Eksempel: lowbwt.sav

Vi skal i dette eksempelet analysere LOW som avhengig variabel og – som i lineær regresjon – skal vi bruke LWTKG, AGE, SMOKE, HT, RACE, PTLD og FTVD som forklaringsvariabler. SMOKE, HT, PTLD og FTVD er kategoriske variabler med to kategorier, og de trenger vi ikke gjøre noe med. RACE er en kategorisk variabel, med tre kategorier. Programmet for logistisk regresjon er enklere enn programmet for lineær regresjon, så nå trenger vi ikke lage dummy-variabler for RACE.

Da er vi klare til å gjøre trinn 1 i metoden som vi beskrev i innledningen til dette kapittelet. Vi gjør da enkle regresjonsanalyser med hver enkelt av variablene LWTKG, AGE, SMOKE, HT, RACE, PTLD og FTVD.

Vi starter med en enkel logistisk regresjon av LOW på LWTKG. Vi går da inn i Analyze/Regression/Binary Logistisk. Vi trekker over LOW i Dependent og LWTKG over i Covariates. Så gå vi til Options. Der klikker vi av på CI for exp(B), og lar det stå 95 der, siden vi ønsker et 95% konfidensintervall. Da ser dialogboksen vår slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1a.jpg

Ved å trykke på Continue og OK, får vi følgende resultat (som i denne sammenhengen er det viktigste for oss):

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1b.jpg

I tabellen finner vi resultatene fra selve regresjonsanalysen. I kolonnen for B finner vi selve regresjonskoeffisienten for den logistiske regresjonsanalysen. Men den verdien vi skal fortolke finner vi under Exp(B). Denne verdien angir hvor mye oddsen for å få et lite barn (dvs. LOW = 1) endrer seg når vi endrer LWTKG med 1 kg. Vi ser at oddsen reduseres med 3% (1 – 0.969), når mors vekt øker med 1 kg. Konfidensintervallet for endringen i odds er (0.944, 0.996).

Den to-sidige p-verdien finner vi under Sig. Den er p = 0.023. Vi oppsummerer altså med at effekten av mors vekt er redusert odds på 3% for å føde et lite lite barn for hver kilos vektøkning, KI = (0.944, 0.996), p = 0.023.

Da gjør vi en helt tilsvarende analyse for sammenhengen mellom LOW og AGE. Vi går da tilbake til Analyze/Regression/Binary Logistic. Vi beholder LOW i Dependent men trekker LWTKG tilbake fra Covariates. Istedenfor trekker vi AGE over i Covariates. Ved å klikke på OK får vi følgende resultat.

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1c.jpg

Vi ser av tabellen over at for hvert år mor blir eldre, reduseres oddsen for å føde et lite barn med 5%. Siden p = 0.105, som er > 0.05, er sammenhengen mellom fødselsvekt og mors alder ikke statistisk signifikant. Dette får vi også bekreftet ved å se på konfidensintervallet som dekker verdien 1. Husk at for oddsforholdet er «nullverdien» lik 1. Men p-verdien er lavere enn det kravet som vi satte over. Men mors alder er en viktig biologisk og medisinsk forklaringsvariabel så vi velger å ta denne med videre i analysen, selv om p-verdien hadde vært > 0.20.

Så går vi videre med variabelen SMOKE. Dette er en to-kategorisk variabel. Som for lineær regresjon, kan den taes direkte inn i regresjonsanalysen, og regresjonskoeffisienten kan tolkes som effekten SMOKE når den går fra 0 (ikke-røyker) til 1 (røyker).

Vi gjør da som over og går til Analyze/Regression/Binary Logistic. Vi trekker AGE tilbake fra Covariates og trekker over SMOKE. Ved å klikke på OK får vi følgende resultat:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1d.jpg

Av tabellen ser vi at effekten av SMOKE på LOW er statistisk signifikant, p = 0.028. Vi oddsen for å få et lite barn mer enn dobles (2.022) når mor røyker. Et 95% konfidensintervall for økningen i odds er (1.08, 3.78).

Denne analysen kan vi også gjøre ved en analyse av krysstabellen mellom LOW og SMOKE, se avsnitt 11.4.2. Da finner vi følgende krysstabell og oddsforhold:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1e.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1f.jpg

Her ser vi oddsforholdet er 2.022, med et konfidensintervall på (1.08, 3.78). Dette er det samme som vi fant ved logistisk regresjon. Som for lineær regresjon, der vi hadde at en regresjonsanalyse med en kategorisk forklaringsvariabel med to kategorier er det samme som å gjøre en t-test for to uavhengige utvalg, finner vi her at det er det samme å lage en krysstabell og beregne OR derfra, som å gjøre en logistisk regresjonsanalyse.

La oss så gå videre med RACE. Her må vi huske at RACE er en kategorisk variabel med tre kategorier. Vi går da inn i Analyze/Regression/Binary Logistic. Vi trekker SMOKE tilbake fra Covariates og trekker over RACE i Covariates. Nå må vi markere at RACE er en kategorisk variabel. Det gjør vi ved klikke av på Categorical. Her trekker vi RACE over i Categorical Covariates. Til slutt må vi merke av på at vi ønsker å ha første kategori som referansekategori. Dette er i samsvar med slik vi har definert dummy-variablene. Da vi trykke på Change. Da ser dialogboksen vår slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1g.jpg

Ved å klikke på Continue og OK får vi følgende resultat:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1h.jpg

Aller først ser vi at p-verdien for RACE, samlet sett, er 0.085. Variabelen er ikke signifikant, men vi tar den med videre i analysen. Deretter ser vi at oddsforholdet for de to variablene RACE(1) = Black og RACE(2) = Other, vurdert i forhold til referansen RACE = White, er omtrent like store, og ca. 2.0.

Da går vi videre med HT. Da finner vi følgende resultat.

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1i.jpg

Effekten av HT på BWT er statistisk signifikant, p = 0.046. Det å være hypertensive (HT =1) reduserer oddsen for å få det lite barn, til omtrent det halve.

Vi må fortsette med PTLD. For den variabelen finner vi følgende resultat:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1j.jpg

Vi ser at effekten av PTLD er klart statistisk signifikant (p < 0.001). Når PTLD = 1 får vi økt odds på 146% for lav fødselsvekt på barnet.

Til slutt analyserer vi FTVD. Da får vi på lignende måte:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/12.3.1k.jpg

Effekten av FTVD er ikke statistisk signifikant (p = 0.134). Når FTVD = 1 får vi en klart odds for lav fødselsvekt på barnet, nemlig en reduksjon på 38%.