Skillnaden mellan beskrivande och inferensiell statistik

Statistikområdet är indelat i två huvuddelar: beskrivande och inferensiella. Var och en av dessa segment är viktigt och erbjuder olika tekniker som uppnår olika mål. Beskrivande statistik beskriver vad som händer i en population eller datauppsättning. Inferentialstatistik tillåter däremot forskare att ta fynd från en provgrupp och generalisera dem till en större befolkning. De två typerna av statistik har några viktiga skillnader.

Beskrivande statistik

Beskrivande statistik är den typ av statistik som troligen kommer till de flesta människor när de hör ordet ”statistik.” I denna gren av statistik är målet att beskriva. Numeriska mått används för att berätta om funktioner i en uppsättning data. Det finns ett antal artiklar som hör till denna del av statistiken, till exempel:

  • Det genomsnittliga eller måttet på mitten av en datamängd, bestående av medelvärdet, median, läge eller mellanslag
  • Spridningen av en datamängd, som kan mätas med intervallet eller standardavvikelsen
  • Övergripande beskrivningar av data, såsom sammanfattningen av fem nummer
  • Mätningar som skevhet och kurtos
  • Utforskningen av relationer och korrelation mellan parade data
  • Presentation av statistiska resultat i grafisk form

Dessa åtgärder är viktiga och användbara eftersom de gör det möjligt för forskare att se mönster bland data och därmed förstå de data. Beskrivande statistik kan endast användas för att beskriva populationen eller datauppsättningen som studeras: Resultaten kan inte generaliseras till någon annan grupp eller befolkning.

Typer av beskrivande statistik

Det finns två typer av beskrivande statistik som socialvetare använder:

Mätningar av central tendens fångar allmänna trender inom data och beräknas och uttrycks som medelvärde, median och läge. Ett medelvärde berättar för forskarna det matematiska genomsnittet för all datauppsättning, till exempel medelåldern vid första äktenskapet; medianen representerar mitten av datadistributionen, som den ålder som sitter mitt i det åldersintervall som människor först gifter sig med; och läget kan vara den vanligaste åldern då människor gifter sig först.

Spridningsmått beskriver hur informationen distribueras och relaterar till varandra, inklusive:

  • Området, hela värdet som finns i en datauppsättning
  • Frekvensfördelningen, som definierar hur många gånger ett visst värde inträffar i en datauppsättning
  • Kvartiler, undergrupper som bildas i en datauppsättning när alla värden är indelade i fyra lika delar över området
  • Medel absolut avvikelse, genomsnittet för hur mycket varje värde avviker från medelvärdet
  • Varians, som illustrerar hur mycket av en spridning som finns i data
  • Standardavvikelse, som illustrerar spridningen av data relativt medelvärdet

Mätningar på spridning representeras ofta visuellt i tabeller, paj- och stapeldiagram och histogram för att underlätta förståelsen av trenderna inom data.

Inferentialstatistik

Inferentialstatistik produceras genom komplexa matematiska beräkningar som gör det möjligt för forskare att dra slutsatser om en större population baserat på en studie av ett urval som tagits ur det. Forskare använder inferentialstatistik för att undersöka förhållandena mellan variabler i ett urval och sedan göra generaliseringar eller förutsägelser om hur dessa variabler kommer att relatera till en större population.

Det är vanligtvis omöjligt att undersöka varje medlem av befolkningen individuellt. Så forskare väljer en representativ delmängd av befolkningen, kallad ett statistiskt urval, och från denna analys kan de säga något om den befolkning som urvalet kom från. Det finns två huvuddelar av inferentialstatistik:

  • Ett konfidensintervall ger ett intervall av värden för en okänd parameter för populationen genom att mäta ett statistiskt prov. Detta uttrycks i termer av ett intervall och graden av förtroende för att parametern ligger inom intervallet.
  • Test av betydelse eller hypotesundersökning där forskare gör anspråk på befolkningen genom att analysera ett statistiskt prov. Genom design finns det en viss osäkerhet i denna process. Detta kan uttryckas i betydelse.

Tekniker som samhällsvetenskapsmän använder för att undersöka förhållandena mellan variabler och därmed skapa statistiska inferensstatistik inkluderar linjära regressionsanalyser, logistiska regressionsanalyser, ANOVA, korrelationsanalyser, strukturell ekvationsmodellering och överlevnadsanalys. När forskare utför statistik med inferensstatistik gör forskare ett test av betydelse för att avgöra om de kan generalisera sina resultat till en större befolkning. Vanliga tester av betydelse inkluderar chi-square och t-test. Dessa berättar för forskarna om sannolikheten att resultaten av deras analys av provet är representativa för befolkningen som helhet.

Beskrivande kontra inferensiell statistik

Även om beskrivande statistik är till hjälp för att lära sig saker som spridning och centrum för data, kan ingenting i beskrivande statistik användas för att göra några generaliseringar. I beskrivande statistik anges mätningar som medelvärdet och standardavvikelsen som exakta siffror.

Även om inferentialstatistik använder vissa liknande beräkningar - som medelvärdet och standardavvikelsen - är fokusen annorlunda för inferensstatistiken. Inferensstatistik börjar med ett urval och generaliseras sedan till en befolkning. Denna information om en befolkning anges inte som ett nummer. Istället uttrycker forskare dessa parametrar som en rad potentiella nummer, tillsammans med en viss förtroende.