Statistikområdet är indelat i två huvuddelar: beskrivande och inferensiella. Var och en av dessa segment är viktigt och erbjuder olika tekniker som uppnår olika mål. Beskrivande statistik beskriver vad som händer i en population eller datauppsättning. Inferentialstatistik tillåter däremot forskare att ta fynd från en provgrupp och generalisera dem till en större befolkning. De två typerna av statistik har några viktiga skillnader.
Beskrivande statistik är den typ av statistik som troligen kommer till de flesta människor när de hör ordet ”statistik.” I denna gren av statistik är målet att beskriva. Numeriska mått används för att berätta om funktioner i en uppsättning data. Det finns ett antal artiklar som hör till denna del av statistiken, till exempel:
Dessa åtgärder är viktiga och användbara eftersom de gör det möjligt för forskare att se mönster bland data och därmed förstå de data. Beskrivande statistik kan endast användas för att beskriva populationen eller datauppsättningen som studeras: Resultaten kan inte generaliseras till någon annan grupp eller befolkning.
Det finns två typer av beskrivande statistik som socialvetare använder:
Mätningar av central tendens fångar allmänna trender inom data och beräknas och uttrycks som medelvärde, median och läge. Ett medelvärde berättar för forskarna det matematiska genomsnittet för all datauppsättning, till exempel medelåldern vid första äktenskapet; medianen representerar mitten av datadistributionen, som den ålder som sitter mitt i det åldersintervall som människor först gifter sig med; och läget kan vara den vanligaste åldern då människor gifter sig först.
Spridningsmått beskriver hur informationen distribueras och relaterar till varandra, inklusive:
Mätningar på spridning representeras ofta visuellt i tabeller, paj- och stapeldiagram och histogram för att underlätta förståelsen av trenderna inom data.
Inferentialstatistik produceras genom komplexa matematiska beräkningar som gör det möjligt för forskare att dra slutsatser om en större population baserat på en studie av ett urval som tagits ur det. Forskare använder inferentialstatistik för att undersöka förhållandena mellan variabler i ett urval och sedan göra generaliseringar eller förutsägelser om hur dessa variabler kommer att relatera till en större population.
Det är vanligtvis omöjligt att undersöka varje medlem av befolkningen individuellt. Så forskare väljer en representativ delmängd av befolkningen, kallad ett statistiskt urval, och från denna analys kan de säga något om den befolkning som urvalet kom från. Det finns två huvuddelar av inferentialstatistik:
Tekniker som samhällsvetenskapsmän använder för att undersöka förhållandena mellan variabler och därmed skapa statistiska inferensstatistik inkluderar linjära regressionsanalyser, logistiska regressionsanalyser, ANOVA, korrelationsanalyser, strukturell ekvationsmodellering och överlevnadsanalys. När forskare utför statistik med inferensstatistik gör forskare ett test av betydelse för att avgöra om de kan generalisera sina resultat till en större befolkning. Vanliga tester av betydelse inkluderar chi-square och t-test. Dessa berättar för forskarna om sannolikheten att resultaten av deras analys av provet är representativa för befolkningen som helhet.
Även om beskrivande statistik är till hjälp för att lära sig saker som spridning och centrum för data, kan ingenting i beskrivande statistik användas för att göra några generaliseringar. I beskrivande statistik anges mätningar som medelvärdet och standardavvikelsen som exakta siffror.
Även om inferentialstatistik använder vissa liknande beräkningar - som medelvärdet och standardavvikelsen - är fokusen annorlunda för inferensstatistiken. Inferensstatistik börjar med ett urval och generaliseras sedan till en befolkning. Denna information om en befolkning anges inte som ett nummer. Istället uttrycker forskare dessa parametrar som en rad potentiella nummer, tillsammans med en viss förtroende.