En normalfördelning är oftare känd som en klockkurva. Denna typ av kurva dyker upp i hela statistiken och den verkliga världen.
Till exempel, efter att jag har testat i någon av mina klasser, är en sak jag gillar att göra en graf över alla poäng. Jag skriver vanligtvis ner 10 poängområden som 60-69, 70-79 och 80-89, och sätter sedan ett stämmer för varje testresultat i det intervallet. Nästan varje gång jag gör detta uppstår en bekant form. Några studenter klarar sig mycket bra och några klarar sig mycket dåligt. Ett gäng poäng hamnar ihop runt medelvärdet. Olika tester kan resultera i olika medel och standardavvikelser, men grafens form är nästan alltid densamma. Denna form kallas ofta klockkurvan.
Varför kalla det en klockkurva? Klockkurvan får sitt namn helt enkelt för att dess form liknar en klocka. Dessa kurvor visas under hela statistikstudien, och deras betydelse kan inte betonas över.
För att vara teknisk kallas de typer av klockkurvor som vi bryr oss mest om i statistik normalt sannolikhetsfördelningar. För vad som följer kommer vi bara att anta att klockkurvorna vi pratar om är normala sannolikhetsfördelningar. Trots namnet "klockkurva" definieras dessa kurvor inte av sin form. Istället används en skrämmande utseende formel som den formella definitionen för klockkurvor.
Men vi behöver verkligen inte oroa oss för mycket om formeln. De enda två siffrorna som vi bryr oss om i det är medelvärdet och standardavvikelsen. Klockkurvan för en given datauppsättning har centret vid medelvärdet. Det är här den högsta punkten på kurvan eller "toppen av klockan" ligger. En dataupps standardavvikelse avgör hur spridd vår klockkurva är. Ju större standardavvikelse, desto mer spridning av kurvan.
Det finns flera funktioner i klockkurvor som är viktiga och skiljer dem från andra kurvor i statistik:
Om vi vet att en klockkurva modellerar våra data, kan vi använda ovanstående funktioner i klockkurvan för att säga en hel del. Gå tillbaka till testexemplet, anta att vi har 100 studenter som tog ett statistikprov med en genomsnittlig poäng på 70 och standardavvikelse på 10.
Standardavvikelsen är 10. Subtrahera och lägg till 10 till medelvärdet. Detta ger oss 60 och 80. Genom regeln 68-95-99.7 skulle vi förvänta oss att cirka 68% av 100, eller 68 elever får poäng mellan 60 och 80 i testet.
Två gånger är standardavvikelsen 20. Om vi subtraherar och lägger till 20 till medelvärdet har vi 50 och 90. Vi kan förvänta oss att cirka 95% av 100, eller 95 elever får poäng mellan 50 och 90 i testet.
En liknande beräkning säger att alla effektivt gjorde 40 till 100 i testet.
Det finns många applikationer för klockkurvor. De är viktiga i statistiken eftersom de modellerar en mängd olika verkliga data. Som nämnts ovan är testresultaten en plats där de dyker upp. Här är några andra:
Även om det finns otaliga tillämpningar av klockkurvor är det inte lämpligt att använda i alla situationer. Vissa statistiska datauppsättningar, såsom utrustningsfel eller inkomstfördelningar, har olika former och är inte symmetriska. Andra gånger kan det finnas två eller flera lägen, till exempel när flera elever klarar sig mycket bra och flera klarar sig mycket dåligt på ett test. Dessa applikationer kräver användning av andra kurvor som definieras annorlunda än klockkurvan. Kunskap om hur uppsättningen av data i fråga erhölls kan hjälpa till att avgöra om en klockkurva ska användas för att representera uppgifterna eller inte.