En normalfördelning av data är en i vilken majoriteten av datapunkter är relativt lika, vilket innebär att de förekommer inom ett litet värdeintervall med färre outliers på datorns höga och låga ändar.
När data vanligtvis distribueras resulterar plottning av dem på en graf för en klockformad och symmetrisk bild som ofta kallas klockkurvan. I en sådan fördelning av data är medel, median och läge alla samma värde och sammanfaller med kurvens topp.
Men inom samhällsvetenskap är en normalfördelning mer ett teoretiskt ideal än en gemensam verklighet. Konceptet och tillämpningen av det som en lins för att undersöka data är genom ett användbart verktyg för att identifiera och visualisera normer och trender inom en datamängd.
En av de mest märkbara egenskaperna hos en normalfördelning är dess form och perfekta symmetri. Om du viker en bild av en normalfördelning exakt i mitten, kommer du med två lika halvor, var och en av speglarna av den andra. Detta innebär också att hälften av observationerna i data faller på endera sidan av mitten av distributionen.
Mittpunkten för en normalfördelning är den punkt som har den maximala frekvensen, vilket betyder antalet eller svarskategorin med flest observationer för den variabeln. Normalfördelningens mittpunkt är också den punkt där tre mått faller: medelvärdet, median och läge. I en helt normal fördelning är dessa tre mått lika många.
I alla normala eller nästan normala fördelningar finns det en konstant andel av området under kurvan som ligger mellan medelvärdet och varje givet avstånd från medelvärdet när det mäts i standardavvikelseenheter. I alla normala kurvor faller till exempel 99,73 procent av alla fall inom tre standardavvikelser från medelvärdet, 95,45 procent av alla fall faller inom två standardavvikelser från medelvärdet och 68,27 procent av fallen faller inom en standardavvikelse från medelvärdet.
Normala fördelningar representeras ofta i standardpoäng eller Z-poäng, som är siffror som berättar avståndet mellan en faktisk poäng och medelvärdet i termer av standardavvikelser. Standardnormfördelningen har ett medelvärde på 0,0 och en standardavvikelse på 1,0.
Även om en normalfördelning är teoretisk finns det flera variabler som forskare studerar som liknar en normal kurva. Till exempel liknar standardiserade testresultat som SAT, ACT och GRE normalt en normalfördelning. Höjd, atletisk förmåga och många sociala och politiska attityder hos en given befolkning liknar vanligtvis en klockkurva.
Idealet för en normalfördelning är också användbart som jämförelsepunkt när data normalt inte distribueras. Till exempel antar de flesta att fördelningen av hushållsinkomster i USA skulle vara en normalfördelning och liknar klockkurvan när de ritas på en graf. Detta skulle innebära att de flesta amerikanska medborgare tjänar på mellaninkomsterna, eller med andra ord, att det finns en hälsosam medelklass. Samtidigt skulle antalet personer i de lägre ekonomiska klasserna vara litet, liksom antalet i de övre klasserna. Den verkliga fördelningen av hushållsinkomster i USA liknar dock inte alls en klockkurva. Majoriteten av hushållen faller i det låga till det lägre medelområdet, vilket innebär att det finns fler fattiga människor som kämpar för att överleva än det finns människor som lever bekväma medelklassliv. I det här fallet är idealet för en normalfördelning användbart för att illustrera inkomstjämlikhet.