Hvilke variabler bør være med i en regresjonsmodell?

    ()

    sporsmal_grey_rgb
    Artikkel

    Valg av variabler som skal inkluderes i en regresjonsmodell, avhenger i stor grad av forskningsspørsmålet og studiedesignen.

    Det kan være hensiktsmessig å dele observasjonelle studier i tre kategorier: deskriptive, prediktive og kausale (1). Eksempler på forskningsspørsmål i de tre kategoriene er vist i tabell 1. I de to sistnevnte er det ofte aktuelt å benytte en regresjonsmodell i den statistiske analysen.

    Tabell 1

    Eksempler på forskningsspørsmål i ulike kategorier observasjonelle studier

    Deskriptiv

    Prediktiv

    Kausal

    Prevalens av atrieflimmer blant individer > 65 år

    Sannsynlighet for iskemisk hjerneslag for individer med gitte karakteristika

    Effekt av antikoagulasjonsbehandling på hjerneslagrisiko for individer med gitte karakteristika

    Prediksjonsmodeller

    Prediksjonsmodeller

    Formålet med en prediktiv studie kan for eksempel være å lage en prediksjonsmodell som kan brukes til å estimere sannsynligheten for hjerneslag innen 10 år for en person med visse karakteristika (kjønn, alder, blodtrykk, m.m.). I en prediksjonsmodell inkluderer man de variablene som samlet sett gir en god prediksjon, basert på data. Man gjør ingen kausal fortolkning av effekten av de inkluderte variablene (2).

    En praktisk anvendelig prediksjonsmodell bør kun inkludere variabler som er enkle å måle i det kliniske arbeidet. En variabel som baseres på observasjoner gjort av klinikere, bør i tillegg ha høyt intra- og interobservatørsamsvar. Variabelen bør være sterkt assosiert med det som skal predikeres, men bør ikke inkluderes kun basert på p-verdi. Størrelsen av estimatet er heller ikke alltid det viktigste. For eksempel vil en binær variabel med oddsratio på 2,0 være mer relevant enn en (også binær) variabel med oddsratio på 2,5, dersom den første variabelen har en prevalens på 50 % og den andre en prevalens på 1 % (3). Nyttige retningslinjer for slike kliniske prediksjonsmodeller er beskrevet av Collins og medarbeidere (3).

    Prediksjonsmodeller bør valideres. Dette kan for eksempel gjøres ved å dele opp det aktuelle datasettet i et treningssett (som man bruker til å bygge modellen) og et testsett, eller ved å bruke tilfeldige utvalg fra datasettet, som ved bootstrapping (4). I tillegg er det ønskelig å teste modellen på et eksternt datasett.

    Kausale modeller

    Kausale modeller

    Randomiserte kontrollerte studier er ideelle for å trekke kausale slutninger. Siden slike studier ikke alltid kan gjennomføres, blir observasjonelle studier også benyttet til å estimere effekt av en eksponering eller behandling. Det er ofte nyttig å tegne en rettet asyklisk graf (directed acyclic graph, DAG) for å skaffe oversikt over hvilke variabler som kan påvirke eksponering og utfall. Disse kalles konfunderende variabler, og må tas med i modellen. Her bør man både bruke klinisk skjønn og basere seg på publisert litteratur. Under strenge antagelser, blant annet ingen umålt konfundering, er det mulig å estimere kausale effekter fra observasjonelle data. Slike antakelser kan imidlertid ikke verifiseres ut fra observerte data, og i praksis kjenner vi ikke nødvendigvis alle mulige konfundere. Likevel kan det noen ganger være rimelig å anta at sammenhengen er kausal dersom studien er godt planlagt og gjennomført (5, 6).

    I en kausal studie er det eksponeringen som er det vesentlige, og effekten av de andre variablene i analysen fortolkes ikke. I en prediksjonsstudie er derimot alle de inkluderte variablene relevante (7).

    Interaksjoner

    Interaksjoner

    Noen ganger avhenger sammenhengen mellom eksponering og utfall av en annen variabel, for eksempel kan effekten av en behandling være avhengig av nivået av en biomarkør. Da er det rimelig å inkludere et interaksjonsledd i modellen. Igjen er et statistisk signifikansnivå på 5 % neppe det beste kriteriet for å vurdere hvorvidt det er en interaksjon, blant annet fordi interaksjonstester har lav styrke. Dersom det er en tydelig interaksjonseffekt, bør estimatene presenteres separat for de aktuelle undergruppene.

    Følg analyseplanen

    Følg analyseplanen

    Før man gjennomfører analysene, bør man skrive en statistisk analyseplan (8). Et sentralt punkt i planen vil være hvilke variabler som skal inkluderes i analysen, og en begrunnelse for valget.

    Kommentarer  ( 0 )
    PDF
    Skriv ut
    Kommenter artikkel

    Anbefalte artikler