3.1 Datatyper
I medisin er vi interesserte i beregninger av størrelser som gjennomsnitt, variasjon og sammenhenger. Hvordan slike størrelser skal beregnes, er avhengig av hva slags type data som inngår i analysen, og det er viktig å uttrykke størrelsene på måleskalaer som er egnet nettopp for dem. Siden beregningene er numeriske (tallmessige), er det naturlig å måle på numeriske måleskalaer. Presentasjonen av data og statistiske analyser vil avhenge av måleskalaen. Vi skiller vanligvis mellom kategoriske og numeriske måleskalaer, se figuren nedenfor. Numeriske måledata kalles oftest kontinuerlige data, slik at det er like vanlig skille mellom kategoriske og kontinuerlige data.
![]() |
En nominal variabel inndeles i ulike kategorier, og det er ingen naturlig ordning mellom kategoriene. Eksempler på slike variabler kan være sykdom og røyking. Her er sykdom inndelt i kategoriene friske og syke, og røyking er inndelt i kategoriene ikke-røykere og røykere. I statistiske analyser det vanlig å angi referansekategorien med verdien 0 og den andre kategorien med 1. Dette betyr at den kategorien vi ønsker å sammenligne med, gir vi verdien 0 og den andre får da verdien 1. Siden vi alltid ønsker å sammenligne de syke med de friske, gir vi de friske verdien 0 og de syke verdien 1. Tilsvarende gir vi røykerne verdien 1 og ikke-røykerne verdien 0, siden vi ønsker å sammenligne røykerne med ikke-røykerne.
En ordinal variabel deles inn i bestemte kategorier, på en slik måte at det finnes en underliggende ordning (avstandsmål) mellom kategoriene. Et eksempel på en ordinal variabel kan være røykevaner, med kategoriene ikke-røyker (med kategoriverdien 0), tidligere røyker (kategoriverdien 1), røyker av og til (kategoriverdien 2) og røyker daglig (kategoriverdien 3). Antall ganger en hendelse inntreffer, er ofte av interesse. Slike data kalles telledata. Eksempler kan være antall døde eller syke i en bestemt tidsperiode.
Kontinuerlige variabler karakteriseres ved at vi kan måle avstand mellom de ulike verdiene. Eksempler på dette kan være vekt, konsentrasjon, blodtrykk og alder, med verdier på variablene angitt direkte ved de observerte verdiene.
I SPSS er det viktig å ha klart for seg hva slags type type vi skal analysere. Valg av hvordan vi presenterer data (ved frekvensoversikter, histogrammer eller gjennomsnitt og median) avhenger av om vi har kategoriske eller kontinuerlige data.
