Termen klockkurva används för att beskriva det matematiska begreppet som kallas normalfördelning, ibland kallad Gaussisk distribution. "Klockkurva" avser klockformen som skapas när en linje plottas med hjälp av datapunkterna för ett objekt som uppfyller kriterierna för normalfördelning.
I en klockkurva innehåller mitten det största värdet och därför är det den högsta punkten på linjens båge. Denna punkt hänvisas till medelvärdet, men i enkla termer är det det högsta antalet förekomster av ett element (i statistiska termer, läget).
Det viktiga att notera om en normalfördelning är att kurvan är koncentrerad i mitten och minskar på båda sidor. Detta är betydelsefullt i och med att uppgifterna har en mindre tendens att producera ovanligt extrema värden, så kallade outliers, jämfört med andra distributioner. Klockkurvan betyder också att data är symmetriska. Detta innebär att du kan skapa rimliga förväntningar på möjligheten att ett utfall kommer att ligga inom ett område till vänster eller höger om mitten, när du har uppmätt mängden avvikelse som finns i datan..
En kurvkurva beror på två faktorer: medelvärdet och standardavvikelsen. Medelvärdet identifierar centrumets position och standardavvikelsen bestämmer klockans höjd och bredd. Till exempel skapar en stor standardavvikelse en klocka som är kort och bred medan en liten standardavvikelse skapar en hög och smal kurva.
För att förstå sannolikhetsfaktorerna för en normalfördelning måste du förstå följande regler:
Punkt 2, 3 och 4 ovan benämns ibland den empiriska regeln eller 68-95-99.7-regeln. När du bestämmer att data normalt distribueras (klockböjning) och beräknar medelvärdet och standardavvikelsen, kan du bestämma sannolikheten för att en enda datapunkt kommer att falla inom ett givet intervall av möjligheter.
Ett bra exempel på en klockkurva eller normalfördelning är rullen med två tärningar. Distributionen är centrerad kring siffran sju och sannolikheten minskar när du rör dig bort från mitten.
Här är den procentuella chansen för olika resultat när du rullar två tärningar.
Normala fördelningar har många bekväma egenskaper, så i många fall, särskilt i fysik och astronomi, antas slumpmässiga variationer med okända fördelningar ofta vara normala för att möjliggöra sannolikhetsberäkningar. Även om detta kan vara ett farligt antagande är det ofta en bra tillnärmning på grund av ett överraskande resultat känt som Centrala gränsvärdessatsen.
Denna sats säger att medelvärdet för varje uppsättning varianter med någon distribution med ett begränsat medelvärde och varians tenderar att uppstå i en normalfördelning. Många vanliga attribut som testresultat eller höjd följer ungefär normala fördelningar, med få medlemmar i de höga och låga ändarna och många i mitten.
Det finns vissa typer av data som inte följer ett normalt distributionsmönster. Dessa datauppsättningar bör inte tvingas försöka passa en klockkurva. Ett klassiskt exempel skulle vara studentbetyg, som ofta har två lägen. Andra typer av data som inte följer kurvan inkluderar inkomster, befolkningsökning och mekaniska fel.