Exempel på ett permutationstest

En fråga som det alltid är viktigt att ställa i statistik är: "Beror det observerade resultatet på grund av en slump, eller är det statistiskt signifikant?" En klass av hypotestester, kallad permutationstest, tillåter oss att testa denna fråga. Översikten och stegen i ett sådant test är:

Vi delade våra ämnen i en kontrollgrupp och en experimentell grupp. Nollhypotesen är att det inte finns någon skillnad mellan dessa två grupper.
Tillämpa en behandling på den experimentella gruppen.
Mät svaret på behandlingen
Tänk på varje möjlig konfiguration av den experimentella gruppen och det observerade svaret.
Beräkna ett p-värde baserat på vårt observerade svar relativt alla potentiella experimentgrupper.

Detta är en översikt av en permutation. För att beskriva denna översikt kommer vi att spendera tid på att titta på ett genomarbetat exempel på ett sådant permutationstest i detalj.

Exempel

Anta att vi studerar möss. I synnerhet är vi intresserade av hur snabbt mössen slutför en labyrint som de aldrig har stött på tidigare. Vi vill tillhandahålla bevis för en experimentell behandling. Målet är att visa att möss i behandlingsgruppen löser labyrinten snabbare än obehandlade möss.

Vi börjar med våra ämnen: sex möss. För enkelhets skull kommer mössen att hänvisas till av bokstäverna A, B, C, D, E, F. Tre av dessa möss ska slumpmässigt väljas för den experimentella behandlingen, och de andra tre placeras i en kontrollgrupp där försökspersonerna får placebo.

Därefter väljer vi slumpmässigt i vilken ordning mössen väljs för att köra labyrinten. Tiden för att avsluta labyrinten för alla möss kommer att noteras, och ett medelvärde för varje grupp kommer att beräknas.

Anta att vårt slumpmässiga urval har möss A, C och E i den experimentella gruppen, med de andra mössen i placebokontrollgruppen. Efter att behandlingen har genomförts, väljer vi slumpmässigt ordningen för mössen att springa genom labyrinten.

Körtiden för var och en av mössen är:

Mus A kör loppet på 10 sekunder
Mus B kör loppet på 12 sekunder
Mus C kör loppet på 9 sekunder
Mus D kör loppet på 11 sekunder
Mus E kör loppet på 11 sekunder
Mus F kör loppet på 13 sekunder.

Den genomsnittliga tiden för att slutföra labyrinten för mössen i den experimentella gruppen är 10 sekunder. Den genomsnittliga tiden för att slutföra labyrinten för de i kontrollgruppen är 12 sekunder.

Vi kan ställa ett par frågor. Är behandlingen verkligen orsaken till den snabbare genomsnittliga tiden? Eller var vi bara tur i vårt val av kontroll- och experimentgrupp? Behandlingen kan ha haft ingen effekt och vi valde slumpmässigt de långsammare mössen för att få placebo och snabbare möss för att få behandlingen. Ett permutationstest hjälper till att besvara dessa frågor.

hypoteser

Hypoteserna för vårt permutationstest är:

Nollhypotesen är uttalandet om ingen effekt. För detta specifika test har vi H₀: Det finns ingen skillnad mellan behandlingsgrupper. Medeltiden för att köra labyrinten för alla möss utan behandling är densamma som medeltiden för alla möss med behandlingen.
Den alternativa hypotesen är vad vi försöker fastställa bevis till förmån för. I det här fallet skulle vi ha H_en: Medeltiden för alla möss med behandlingen är snabbare än medeltiden för alla möss utan behandlingen.

permutationer

Det finns sex möss, och det finns tre platser i den experimentella gruppen. Detta innebär att antalet möjliga experimentgrupper ges med antalet kombinationer C (6,3) = 6! / (3! 3!) = 20. De återstående individerna skulle ingå i kontrollgruppen. Så det finns 20 olika sätt att slumpmässigt välja individer i våra två grupper.

Tilldelningen av A, C och E till den experimentella gruppen gjordes slumpmässigt. Eftersom det finns 20 sådana konfigurationer har den specifika med A, C och E i den experimentella gruppen en sannolikhet på 1/20 = 5%.

Vetenskap