En faktoranalys av varians, även känd som ANOVA, ger oss ett sätt att göra flera jämförelser av flera befolkningsmedel. I stället för att göra detta på ett parvis sätt kan vi samtidigt titta på alla de medel som övervägs. För att utföra ett ANOVA-test, måste vi jämföra två typer av variationer, variationen mellan provmedlet och variationen i vart och ett av våra prover.
Vi kombinerar all denna variation i en enda statistik, kallad F statistik eftersom den använder F-distributionen. Vi gör detta genom att dela variationen mellan proverna med variationen i varje prov. Sättet att göra detta hanteras vanligtvis av programvara, men det finns ett visst värde att se en sådan beräkning fungera.
Det kommer att bli lätt att gå vilse i det följande. Här är listan över steg som vi kommer att följa i exemplet nedan:
Programvara gör allt detta ganska enkelt, men det är bra att veta vad som händer bakom kulisserna. I det följande utarbetar vi ett exempel på ANOVA enligt stegen som anges ovan.
Anta att vi har fyra oberoende populationer som uppfyller villkoren för enfaktor ANOVA. Vi vill testa nollhypotesen H0: μ1 = μ2 = μ3 = μ4. För detta exempel kommer vi att använda ett prov med storlek tre från var och en av de populationer som studeras. Uppgifterna från våra prover är:
Medelvärdet för alla uppgifter är 9.
Vi beräknar nu summan av de kvadratiska avvikelserna från varje provmedelvärde. Detta kallas summan av felkvadrater.
Vi lägger sedan till alla dessa summan av kvadratiska avvikelser och erhåller 6 + 18 + 18 + 6 = 48.
Nu beräknar vi summan av rutorna för behandling. Här tittar vi på kvadratavvikelserna för varje provmedelvärde från det totala medelvärdet och multiplicerar detta antal med en mindre än antalet populationer:
3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.
Innan vi fortsätter till nästa steg behöver vi graderna av frihet. Det finns 12 datavärden och fyra sampel. Således är antalet grader av behandlingsfrihet 4 - 1 = 3. Antalet grader av felfrihet är 12 - 4 = 8.
Vi delar nu vår summa av rutorna med lämpligt antal frihetsgrader för att få medelkvadraterna.
Det sista steget i detta är att dela medelkvadratet för behandling med medelkvadratet för fel. Detta är F-statistiken från uppgifterna. Således för vårt exempel F = 10/6 = 5/3 = 1.667.
Värdenstabeller eller programvara kan användas för att bestämma hur troligt det är att få ett värde av F-statistiken så extrem som detta värde av en slump.