En introduktion till klockkurvan

En normalfördelning är oftare känd som en klockkurva. Denna typ av kurva dyker upp i hela statistiken och den verkliga världen.

Till exempel, efter att jag har testat i någon av mina klasser, är en sak jag gillar att göra en graf över alla poäng. Jag skriver vanligtvis ner 10 poängområden som 60-69, 70-79 och 80-89, och sätter sedan ett stämmer för varje testresultat i det intervallet. Nästan varje gång jag gör detta uppstår en bekant form. Några studenter klarar sig mycket bra och några klarar sig mycket dåligt. Ett gäng poäng hamnar ihop runt medelvärdet. Olika tester kan resultera i olika medel och standardavvikelser, men grafens form är nästan alltid densamma. Denna form kallas ofta klockkurvan.

Varför kalla det en klockkurva? Klockkurvan får sitt namn helt enkelt för att dess form liknar en klocka. Dessa kurvor visas under hela statistikstudien, och deras betydelse kan inte betonas över.

Vad är en klockkurva?

För att vara teknisk kallas de typer av klockkurvor som vi bryr oss mest om i statistik normalt sannolikhetsfördelningar. För vad som följer kommer vi bara att anta att klockkurvorna vi pratar om är normala sannolikhetsfördelningar. Trots namnet "klockkurva" definieras dessa kurvor inte av sin form. Istället används en skrämmande utseende formel som den formella definitionen för klockkurvor.

Men vi behöver verkligen inte oroa oss för mycket om formeln. De enda två siffrorna som vi bryr oss om i det är medelvärdet och standardavvikelsen. Klockkurvan för en given datauppsättning har centret vid medelvärdet. Det är här den högsta punkten på kurvan eller "toppen av klockan" ligger. En dataupps standardavvikelse avgör hur spridd vår klockkurva är. Ju större standardavvikelse, desto mer spridning av kurvan.

Viktiga funktioner i en klockkurva

Det finns flera funktioner i klockkurvor som är viktiga och skiljer dem från andra kurvor i statistik:

En klockkurva har ett läge, som sammanfaller med medelvärdet och median. Detta är mitt på kurvan där den är som högst.
En klockkurva är symmetrisk. Om det veckades längs en vertikal linje i medelvärdet, båda halvorna skulle passa perfekt eftersom de är spegelbilder av varandra.
En klockkurva följer regeln 68-95-99.7, som ger ett bekvämt sätt att utföra uppskattade beräkningar:
- Cirka 68% av all data ligger inom en standardavvikelse från medelvärdet.
- Cirka 95% av all data ligger inom två standardavvikelser från medelvärdet.
- Cirka 99,7% av uppgifterna ligger inom tre standardavvikelser från medelvärdet.

Ett exempel

Om vi vet att en klockkurva modellerar våra data, kan vi använda ovanstående funktioner i klockkurvan för att säga en hel del. Gå tillbaka till testexemplet, anta att vi har 100 studenter som tog ett statistikprov med en genomsnittlig poäng på 70 och standardavvikelse på 10.

Standardavvikelsen är 10. Subtrahera och lägg till 10 till medelvärdet. Detta ger oss 60 och 80. Genom regeln 68-95-99.7 skulle vi förvänta oss att cirka 68% av 100, eller 68 elever får poäng mellan 60 och 80 i testet.

Två gånger är standardavvikelsen 20. Om vi subtraherar och lägger till 20 till medelvärdet har vi 50 och 90. Vi kan förvänta oss att cirka 95% av 100, eller 95 elever får poäng mellan 50 och 90 i testet.

En liknande beräkning säger att alla effektivt gjorde 40 till 100 i testet.

Användning av klockkurvan

Det finns många applikationer för klockkurvor. De är viktiga i statistiken eftersom de modellerar en mängd olika verkliga data. Som nämnts ovan är testresultaten en plats där de dyker upp. Här är några andra:

Upprepade mätningar av en utrustning
Mätningar av egenskaper i biologi
Ungefärliga chanshändelser som att vända ett mynt flera gånger
Höjder för elever på en viss klassnivå i ett skolområde

När man inte ska använda klockkurvan

Även om det finns otaliga tillämpningar av klockkurvor är det inte lämpligt att använda i alla situationer. Vissa statistiska datauppsättningar, såsom utrustningsfel eller inkomstfördelningar, har olika former och är inte symmetriska. Andra gånger kan det finnas två eller flera lägen, till exempel när flera elever klarar sig mycket bra och flera klarar sig mycket dåligt på ett test. Dessa applikationer kräver användning av andra kurvor som definieras annorlunda än klockkurvan. Kunskap om hur uppsättningen av data i fråga erhölls kan hjälpa till att avgöra om en klockkurva ska användas för att representera uppgifterna eller inte.

Vetenskap