Variation och standardavvikelse är två nära besläktade mått på variationer som du kommer att höra mycket om i studier, tidskrifter eller statistikklass. Det är två grundläggande och grundläggande begrepp i statistik som måste förstås för att förstå de flesta andra statistiska begrepp eller förfaranden. Nedan granskar vi vad de är och hur man hittar variansen och standardavvikelsen.
Per definition är varians och standardavvikelse båda variationerna för variationer för intervallförhållanden. De beskriver hur mycket variation eller mångfald det finns i en distribution. Både variansen och standardavvikelsen ökar eller minskar baserat på hur nära poängen kluster runt medelvärdet.
Varians definieras som medelvärdet av de kvadratiska avvikelserna från medelvärdet. För att beräkna variansen subtraherar du medelvärdet från varje nummer och kvadrerar sedan resultaten för att hitta de kvadratiska skillnaderna. Du hittar sedan medelvärdet av dessa kvadratiska skillnader. Resultatet är variationen.
Standardavvikelsen är ett mått på hur spridda siffrorna i en distribution är. Det anger hur mycket i genomsnitt var och en av värdena i fördelningen avviker från medelvärdet eller mitten av fördelningen. Det beräknas genom att ta varianternas kvadratrot.
Variationen och standardavvikelsen är viktiga eftersom de berättar för oss saker om datauppsättningen som vi inte kan lära oss bara genom att titta på medelvärdet eller genomsnittet. Föreställ dig som exempel att du har tre yngre syskon: ett syskon som är 13 och tvillingar som är 10 år. I det här fallet skulle medelåldern för dina syskon vara 11. Föreställ dig nu att du har tre syskon, åldrarna 17, 12 , och 4. I det här fallet skulle dina syskons medelålder fortfarande vara 11, men variationen och standardavvikelsen skulle vara större.
Låt oss säga att vi vill hitta variansen och standardavvikelsen för åldern bland din grupp med 5 nära vänner. Åldrarna för dig och dina vänner är 25, 26, 27, 30 och 32.
Först måste vi hitta medelåldern: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Sedan måste vi beräkna skillnaderna från medelvärdet för var och en av de fem vännerna.
25 - 28 = -3
26 - 28 = -2
27-28 = -1
30 - 28 = 2
32 - 28 = 4
Därefter, för att beräkna variansen, tar vi varje skillnad från medelvärdet, kvadraterar det och sedan genomsnittet resultatet.
Varians = ((-3)2 + (-2)2 + (-1)2 + 22 + 42) / 5
= (9 + 4 + 1 + 4 + 16) / 5 = 6,8
Så variansen är 6,8. Och standardavvikelsen är kvadratroten av variansen, som är 2,61. Vad detta betyder är att du och dina vänner i genomsnitt är 2,61 år från varandra i ålder.
Även om det är möjligt att beräkna variansen för hand för mindre datamängder som den här, kan statistiska program också användas för att beräkna variansen och standardavvikelsen.
När du utför statistiska test är det viktigt att vara medveten om skillnaden mellan a befolkning och a prov. För att beräkna standardavvikelsen (eller variansen) för en population, måste du samla in mätningar för alla i gruppen du studerar; för ett prov skulle du bara samla in mätningar från en delmängd av befolkningen.
I exemplet ovan antog vi att gruppen med fem vänner var en befolkning; om vi i stället hade behandlat det som ett prov skulle beräkningen av provets standardavvikelse och provvarians vara något annorlunda (istället för att dela med provstorleken för att hitta variansen, skulle vi först ha dragit en från provstorleken och sedan delat med denna mindre antal).
Variationen och standardavvikelsen är viktig i statistiken, eftersom de utgör grunden för andra typer av statistiska beräkningar. Till exempel är standardavvikelsen nödvändig för att konvertera testresultat till Z-poäng. Variansen och standardavvikelsen spelar också en viktig roll när statistiska tester som t-test utförs.
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Social statistik för ett mångfaldigt samhälle. Thousand Oaks, CA: Pine Forge Press.