6.5 Recode til dummy variabler. Eksempel: lowbwt.sav
Kategoriske variabler kan ha to eller flere verdier. Dersom variabelen har to verdier, gir vi dem verdiene 0 og 1, med 0 for referansekategorien og 1 for den kategorien vi skal sammenligne referansekategorien med. Vi gir altså de eksponerte, for eksempel røykerne, eller de syke verdien 1, og de ueksponerte eller friske verdien 0. Kategoriske variabler med to verdier er greie å bruke i statistiske analyser, siden de kan brukes direkte i analysene.
Slik er det ikke nødvendigvis for kategoriske variabler med flere verdier. I datafilen har vi to variabler som er flerkategoriske, nemlig RACE og LWTKGO. I noen statistiske analyser, slik som i variansanalyser (se kapittel 12.1), kan vi bruke de flerkategoriske variabler direkte. Men i regresjonsanalyser (se kapittel 12.2) kan vi ikke bruke de flerkategoriske variablene. Da må vi bruke så kalte dummy-variable.
Dummy-variabler er et sett av kategoriske variable med to kategorier. Disse skal sammenlignes med en referansekategori. En kategorisk variable med k kategorier trenger k-1 dummy variabler. Vi ser på variabelen RACE som har tre kategorier. Vi lager en frekvensfordeling for RACE, ved Analyze/Descriptive Statistics/Frequencies, trekker RACE over i boksen i midten og klikker på OK. Da får vi følgende frekvensfordeling:
![]() |
Vi har tre kategorier, og vi skal da lage to dummy variabler. Her skal vi nå bruke WHITE som referansekategori. Vi skal nå lage to dummy variabler RACE2 og RACE3, slik som angitt i tabellen nedenfor. Merk at begge variablene har to kategorier, 0 og 1.
| RACE | RACE2 | RACE3 |
| WHITE | 0 | 0 |
| BLACK | 1 | 0 |
| OTHER | 0 | 1 |
Her ser vi at RACE2 = 1 når RACE = BLACK, og RACE3 = 1 bare når RACE = OTHER. Altså vil RACE2 angi at etnisiteten er BLACK, mens RACE3 angir at etnisiteten er OTHER. Omvendt, når RACE = WHITE er RACE2 = RACE3 = 0. Når RACE = BLACK, er RACE2 = 1 og RACE3 = 0. Når RACE = OTHER, er RACE2 = 0 og RACE3 = 1. Vi ser altså at vi trenger de to dummy variablene RACE2 og RACE3 for å beskrive de tre kategoriene i RACE.
Vi skal nå lage RACE2 og RACE3 i SPSS. Først beregner vi RACE2 og RACE3 som begge er identisk lik med RACE. Deretter omkoder vi disse to variablene. Først går vi inn i Transform/Compute, og skriver RACE2 i venstre vindu (Target Variable) og RACE i høyre vindu (Numeric Expression), og så klikker vi på OK. Vi gjør helt tilsvarende med RACE3. Da får vi to nye variabler lagt til på dataarket vårt. Foreløpig er de identiske med RACE.
Da er vi klare til å omkode RACE2 og RACE3. Vi tar først RACE2 og går til Transform/Recode Into Same Variable. Vi trekker RACE2 over i vinduet til høyre. Da åpner det seg en ny knapp med Old and New Values. Vi klikker på den. Vi skriver inn 2 i vinduet med Old Values og 1 i vinduet med New Values, og klikker på Add. Under Old Values går vi så ned til All other values, skriver inn 0 i vinduet New Values og klikker på Add. Da ser dialogboksen slik ut:
![]() |
Da klikker vi på Continue og OK.
Vi gjør da det samme med RACE3. Her skal koden 3 kodes om til 1 og alle andre verdier skal settes til 0.
Når vi har gjort en omkoding, er det en god vane å sjekke at omkoding har gått riktig for seg. Det gjør vi ved lage en frekvensoversikt for den variabelen vi omkoder fra og de vi omkoder til. Vi går derfor inn i Analyze/Descriptive Statistics/Frequencies og trekker over RACE, RACE2 og RACE3. Da får vi følgende resultater:
![]() |
![]() |
![]() |
Her ser vi at RACE2 angir at RACE = BLACK og RACE2 angir at RAC E = OTHER. Omkodingen har blitt riktig.
På filen lowbwt.sav ligger også variablen LWTKGO som er en ordinal variabel. Denne variabelen kan også omkodes til dummy-variabler. Siden LWTKGO har fire kategorier, må vi lage tre dummy variabler. Disse kaller vi LWTKG2, LWTKG3 og LWTKG4. Vi gjør dette på samme måte som for RACE2 og RACE3. Vi bruker LWTKGO = 1 som referanseverdi. LWTKG2 = 1 når LWTKGO = 2, LWTKG3 = 1 når LWTKGO = 3, og LWTKG4 = 1 når LWTKG = 4. Dette gjør vi ved å inn i Transform/Compute og lage tre kopier av LWTKGO, inn i LWTKG2, LWTKG3 og LWTKG4. Deretter går vi til Transform/Recode into Same Variable og rekoder LWTKG2, LWTKG3 og LWTKG4, slik vi gjorde med RACE2 og RACE3. Når vi gjør dette for LWTKG4 ser dialogboksen våre slik ut
![]() |
Som for omkodingen for RACE lager vi nå en frekvensfordeling for LWTKG2, LWTKG3 og LWTKG4. Dette gjør vi ve å gå inn i Analyze/Descriptive Statistics/Frequencies og trekker over de tre variablene i vinduet til høyre. Da får vi følgende frekvensfordeling;
![]() |
![]() |
![]() |
Vi ser at disse frekvensfordelingene stemmer overens med den vi hadde for LWTKGO i kapittel 6.4. Vi sikrer oss nå at vi får lagt denne filen ned i katalogen vår. Det gjør vi på vanlig måte med File/Save As, velge navnet lowbwt.sav og legger den i riktig katalog. Vi vil få beskjed om at filen allerede eksisterer, og om vil overskrive den gamle filen. Vi svarer Yes til det.








