12.4 Overlevelsesanalyse
Overlevelsesanalyse spiller en viktig rolle i medisinsk forskning. Vi registrerer tiden til en begivenhet, som sykdom eller død. Siden ikke alle individene som vi undersøker vil oppleve den begivenheten vi studerer, for eksempel vil ikke alle individene være døde før vi avslutter studien, tiden før begivenheten inntreffer, har vi vanligvis Missing values. Dette kaller vi i overlevelsesanalysen for sensurering. Vi må da alltid ha med en variabel i datasettet som viser om vi har observert tiden til begivenheten eller oppfølgingstiden til begivenheten faktisk er missing.
I overlevelsesanalyse vil vi være interessert i plot overlevelseskurven, som vi kaller Kaplan Meier plott. Vi vil være interessert i om overlevelseskurvene er forskjellige mellom to eller flere grupper, som vi skal teste ved en såkalt log-rank test. Til slutt vil vi være interessert i tid for overlevelse i forhold til flere forklaringsvariabler. Dette er en variant av regresjonsanalyse, som vi kaller Cox-regresjon.
I dette kapittelet skal vi bruke datasettet CVD Risk fra nettsiden http://www.umass.edu/statdata/statdata/stat-survival.html. Oppfølgingstiden til død etter innleggelse på sykehus er registrert for 65 pasienter. Oppfølgingstiden er registrert i variabelen TIME. Det er 32 pasienter som døde av kardiovaskulær sykdom (CVD) og de andre 33 er sensurerte observasjoner. Noen av disse er sensurerte fordi de er døde av andre årsaker, mens for andre har vi ikke registrert tid til død. Informasjon om sensurering ligger i variabelen EV_TYP. Kodene for EV_TYP er EV_TYP = 1 for Death of CVD, EV_TYP = 2 for Death of other Causes, EV_TYP = 3 for Censored. Vi har også data om alder (AGE), og kjønn (GENDER, GENDER = 0 for male, GENDER = 1 for female). Denne datafilen ligger på nettsiden for kurset under navnet cvdrisk.sav. Beskrivelsen av filen på hjemmesiden er som følger:
CVD Risk Data (cvdrisk.dat)
SIZE:
65 Observations, 6 Variables
REFERENCE:
Hosmer, D.W. and Lemeshow, S. and May, S. (2008): Applied Survival Analysis: Regression Modeling of Time to Event Data: Second Edition, John Wiley and Sons Inc., New York, NY
DESCRITPTIVE ABSTRACT:
Description of the variables in the CVD Risk competing risk example in Section 9.6 of reference text.
DISCLAIMER:
This data is also available at the following Wiley's FTP site: ftp//ftp.wiley.com/public/sci_tech_med/survival
LIST OF VARIABLES:
Variable Name | Description | Codes/Values | |
1 | id | Study ID | 1 - 65 |
2 | age | Age | Years |
3 | bmi | Body Mass Index | kg/m**2 |
4 | gender | Gender | 0 = Male, 1 = Female |
5 | time | Follow Up Time | Days |
6 | ev_typ | Event Type | 1 = CVD 2 = Other Cause 0 = Censor |