Empty Use: setheader(no|en,rooturl,roottopic,subtopic,emailcontact,telephone)

6.4 Recode. Eksempel: lowbwt.sav

Vi henter frem filen lowbwt.sav. Vi skal først omkode variablene PTL og FTV. Grunnen til dette finner vi i frekvensfordelingene til disse to variablene. Vi går da til Analyze/Descriptive Statistics/Frequencies. Der trekker vi over PTL og FTV over i boksen med Variable(s) og klikker på OK. Da får vi følgende utskrift:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4taba.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4tabb.jpg

Her ser vi at det er få personer med verdier større enn 1 for PTL (5+1=6) og 42 for FTV (30+7+4+1=42). Vi bør ha grupper av en viss størrelse når vi skal gjøre analyse på dem. Dette henger igjen sammen med at usikkerheten i frekvensfordelingen blir stor for små grupper. Vi bør derfor lage oss større grupper ved å slå sammen kategoriene. Dette gjør vi for PTL og FTV ved at vi omkoder veridene 2 og 3 til verdien 1 for PTL, og 2, 3, 4 og 6 til verdien 1 for FTV. Dermed betyr koden 1 for PTL og FTV at vi har verdien 1 eller større for disse variablene.

For å gjøre dette går vi inn i Transform/Recode into Different Variables. Der trekker vi over PTL over i boksen i midten og angir at vi skal kalle den nye variabelen PTLD. Vi klikker på Old and New Values. Nå må vi angi at verdiene 2 og 3 skal bli omkodet til 1. Det gjør vi i Old Values ved å gå til Range og der angi at 1 til 3 skal få New Value 1. Så klikker vi på Add. Deretter må vi angi at koden 0 for PTL også skal være 0 for PTLD. Dette gjør ved å skrive inn 0 i Old Value og 0 i New Value, og deretter klikke på Add. Da vil dialogboksen vår se slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4a.jpg

Ved å klikke oss gjennom Continue og OK, får vi utført omkodingene våre. Vi gjør det helt tilsvarende for transformasjonen fra FTV til FTVD. Men når vi er i dialogboksen for omkodingen til FTVD, må vi huske at vi i Range må angi at 1 til 6 skal omkodes til 1. For FTVD vil dialogboksen se slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4b.jpg

Etter å klikket på Continue og OK blir også denne transformasjonen utført. Det er en god vane å sjekke at slike omkodinger har gått riktig for seg. Det gjør vi ved å lage en frekvensfordeling for PTLD og FTVD. Vi går da inn Analyze/Descriptive Statistics/Frequencies. Der trekker vi over PTLD og FTVD over i boksen med Variable(s)

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4tabc.jpg

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4tabd.jpg

Vi ser at fordelingen for PTLD og FTVD har blitt riktige. Vi har det samme antall 0’er for begge variablene, og de resterende har fått verdien 1, som da også har blitt riktig.

Legg merke til at det ikke ligger variable label eller value labels til disse to variablene. Slik vil det alltid være for transformerte variabler. Vi kommer tilbake til dette.

I en del situasjoner er det aktuelt å omkode en kontinuerlig variabel til en kategorivariabel. Dette er særlig aktuelt i regresjonsanalyser, når vi er interessert i om sammenhengen mellom den avhengige variabelen og en forklaringsvariabel virkelig er lineær. I slike situasjoner er det naturlig å dele variabelen oppi fire kategorier, etter kvartilene. Kvartilene deler variabelen i fire like store deler. Første kvartil vil da bestå av den fjerdedelen med de minste observasjonene, annen kvartil vil bestå observasjoner som faller ovenfor laveste kvartil, men nedenfor midten av observasjonene. Tredje kvartil vil ha de observasjonene som faller over midten, og er blant de tre fjerdedeler minste observasjonene. Øverste kvartil består av de 25% største observasjonene. Vi vil nå omkode variablene slik at observasjoner som faller i første kvartil får verdien 0, de som faller i annen kvartil får verdien 1, observasjonene i tredje kvartil verdien 3, og observasjonene i fjerde kvartil får verdien 4.

Vi skal anvende dette til variabelen LWTKG. Vi først finne observasjonene som gir oss inndelingen i kvartiler. For å finne disse går vi til Analyze/Descriptive Statistics/Frequencies. Her går vi videre til dialogboksen Statistics. Under Percentile Values klikker vi av på Quartiles. Da ser dialogboksene slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4c.jpg

Ved å klikke på Continue og OK, får vi følgende resultater:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4tabe.jpg

Nå er vi klare til å omkode LWTKG til LWTKGO (O for å vise at dette er en ordinal variabel). Da går vi inn i Transform/Recode into Different Variables. Her trekker vi LWTKG over i boksen i midten, og skriver LWTKGO inn i boksen til høyre (Output Variable). Da må vi klikke på Change, for å få aktivisert denne transformasjonen. Deretter klikker vi på Old and New Values. Da kommer det opp en dialogboks hvor vi skal legge inn verdiene for de fire kvartilene. Vi legger først inn observasjonen i første kvartil. Observasjoner som er mindre eller lik 45.5 skal omkodes til 1. Vi skriver da inn Range Lowest through value: 49,5. Da går vi opp i boksen med New Value og skriver inn 1. Da er vi klar til å klikke på Add. Så går vi videre til neste kvartil. Da klikker vi på Range, og her skriver vi inn 49.6 i øverste boks og 54,45 i nederste boks. Når det er gjort går til New Value og skriver inn 1, og klikker på Add. Da skal vi omkode for tredje kvartil. Vi holder oss til Range og skriver inn 54,5 i øverste boks og 63,225 i nederste boks, og skriver inn 3 i New Value. Vi må også klikke på Add. Til slutt skal vi ta for oss fjerde kvartil. Da går vi til Range Value through HIGHEST, og skriver inn 63,23, og skriver inn 4 i New Value. Da ser dialogboksen slik ut:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4d.jpg

Da klikker vi på Continue og OK, og får utført transformasjonen. For å se at transformasjonen har gått riktig, lager vi en frekvensfordeling for LWTKGO. Det gjør vi ved Analyze/Descriptive Statistics/Frequencies og trekker over LWTKGO i boksen med Variable(s). Når vi klikker på OK får vi følgende utskrift:

https://studmed.uio.no/elaring/lcms16/med-statistikk-2016/spss/images/14.4tabf.jpg

Vi ser at fordelingen er tilnærmet riktig. Vi kan ikke forvente å få nøyaktig 25% av observasjonene i kvartil, siden vi har observasjoner som har like verdier. Fordelingen ser derfor riktig ut.