Artikkel
Før man analyserer data, bør man skrive en statistisk analyseplan. På denne måten gjør man forskningen mer transparent, og man øker reproduserbarheten.
De valgene man tar i forbindelse med de statistiske analysene, vil påvirke de resultatene man får. Hvis valgene rundt håndtering av data og analyser påvirkes av hvilke resultater man får underveis, øker faren for at funnene ikke blir reproduserbare i senere studier. Derfor er det viktig å planlegge analysene på forhånd og å følge planen så godt som mulig. Ellers risikerer man å prøve forskjellige metoder og velge de resultatene som passer best med det man ønsker eller forventer å finne.
Justeringer i analyseplanen
Justeringer i analyseplanen
Det hender man må gjøre justeringer i analyseplanen etter at analysene er påbegynt. Det kan for eksempel skyldes at en variabel viser seg å ha en helt annen fordeling enn det man la til grunn. Det kan også være nødvendig å bruke en enklere analysemodell enn man ideelt sett ønsket, for eksempel at man forenkler en flernivåmodell (1) eller utelater én eller flere variabler fra en regresjonsanalyse. Justeringer i analyseplanen som gjennomføres før avblinding av data, kan beskrives i en oppdatert versjon av den statistiske analyseplanen. Dersom det gjennomføres utforskende analyser i tillegg til de som var forhåndsplanlagt, må dette klart fremgå i presentasjon av resultatene, som presisert i Vancouver-reglene (2) .
Hva inneholder en statistisk analyseplan?
Hva inneholder en statistisk analyseplan?
Forskningsspørsmålet og studiedesignet er styrende for den statistiske analyseplanen. Analyseplanen kan inngå i protokollen for studien, eller være et eget og mer detaljert dokument i tillegg til protokollen, noe som er blitt mer og mer vanlig, spesielt ved randomiserte kontrollerte forsøk. Men en statistisk analyseplan er minst like viktig i observasjonelle studier. For eksempel kan en eksponering eller behandling være assosiert med andre variabler som er potensielle konfundere. Hvilke variabler man vil justere for, bør beskrives før man starter analysene, ettersom slike valg vil påvirke resultatene i større grad enn i randomiserte kontrollerte studier, der behandlingen generelt ikke er assosiert med andre variabler.
I analyseplanen beskrives i detalj de statistiske analysene man planlegger å gjennomføre. En viktig del av dette er å definere hvordan variabler skal håndteres i analysene, for eksempel om en sumskår skal deles opp i delskårer eller kategoriseres etter en klinisk terskelverdi.
Ramme 1 viser eksempler på punkter som kan inngå i en statistisk analyseplan. Denne listen er ikke utfyllende. Detaljerte retningslinjer for en statistisk analyseplan er publisert for kliniske studier (3, 4) og for observasjonelle studier (5) .
Ramme 1 Punkter som kan inngå i en statistisk analyseplan.
Studiens formål
Studiedesign
Definisjon av den primære utfallsvariabelen og eventuelle sekundære utfallsvariabler
Definisjon av analysepopulasjonen, for eksempel behandlingsintensjon (intention-to-treat , ITT) eller per protokoll
Hvilken analysemetode skal benyttes, for eksempel lineær regresjon
Hvilke variabler skal inngå i analysen?
Skal noen av variablene kategoriseres, for eksempel etter en klinisk terskelverdi?
Skal noen av variablene transformeres, for eksempel med logaritmen?
Skal noen av variablene inngå i interaksjoner?
Hvordan skal manglende data håndteres, for eksempel med multippel imputering?
Hvilke antakelser eller forutsetninger skal sjekkes, for eksempel sjekke normalfordeling ved hjelp av QQ-plott?
Hvordan skal eventuelle avvik fra forutsetningene håndteres, for eksempel med gjentatte tilfeldige utvalg (bootstrapping )?
Planlagte sensitivitetsanalyser
Hvilket signifikansnivå skal velges? Skal p -verdier justeres for multiple hypoteser, og i så fall med hvilken metode? (6 )
Hvilken programvare skal brukes?
Når skal man skrive en statistisk analyseplan?
Når skal man skrive en statistisk analyseplan?
Et økende antall medisinske tidsskrift krever at man har skrevet, samt arkivert eller publisert, en statistisk analyseplan i forbindelse med studien man vil publisere. European Medicines Agency skriver følgende i forbindelse med randomiserte studier: «Den statistiske analyseplanen kan skrives som et eget dokument etter at protokollen er ferdig. […] Planen bør ferdigstilles før data blir avblindet.» (vår oversettelse) (7) .
I noen studier publiseres analyseplanen som et omfattende supplement til publikasjonen (8) . I andre studier kan planen være et dokument av omtrent samme omfang som metodebeskrivelsen i den planlagte publikasjonen.
Arbeidet med å skrive en analyseplan er uansett aldri bortkastet. Analysearbeidet vil gå raskere når planen er lagt, og når man skal rapportere resultatene fra studien, kan deler av planen nesten ordrett kopieres inn i metodebeskrivelsen.