Om du tillbringar mycket tid alls på att hantera statistik, kommer du ganska snart in i frasen "sannolikhetsfördelning." Det är här vi verkligen får se hur mycket områdena med sannolikhet och statistik överlappar varandra. Även om detta kan låta som något tekniskt är uttrycket sannolikhetsfördelning egentligen bara ett sätt att prata om att organisera en lista med sannolikheter. En sannolikhetsfördelning är en funktion eller regel som tilldelar sannolikheter till varje värde på en slumpmässig variabel. Distributionen kan i vissa fall listas. I andra fall presenteras det som en graf.
Anta att vi rullar två tärningar och sedan registrerar summan av tärningarna. Sommar från två till 12 är möjliga. Varje summa har en viss sannolikhet att inträffa. Vi kan helt enkelt lista dessa på följande sätt:
Denna lista är en sannolikhetsfördelning för sannolikhetsförsöket att rulla två tärningar. Vi kan också betrakta ovanstående som en sannolikhetsfördelning av den slumpmässiga variabeln som definieras genom att titta på summan av de två tärningarna.
En sannolikhetsfördelning kan graferas, och ibland hjälper detta att visa oss funktioner för distributionen som inte framgick av att bara läsa listan med sannolikheter. Den slumpmässiga variabeln är ritad längs x-axeln, och motsvarande sannolikhet plottas längs y-axel. För en diskret slumpmässig variabel har vi ett histogram. För en kontinuerlig slumpvariabel har vi insidan av en slät kurva.
Reglerna för sannolikhet är fortfarande i kraft och de visar sig på några sätt. Eftersom sannolikheter är större än eller lika med noll måste grafen för en sannolikhetsfördelning ha y-koordinater som inte är negativa. En annan egenskap hos sannolikheter, nämligen att den är den maximala som sannolikheten för en händelse kan vara, dyker upp på ett annat sätt.
Grafen för en sannolikhetsfördelning är konstruerad på ett sådant sätt att områden representerar sannolikheter. För en diskret sannolikhetsfördelning beräknar vi verkligen bara områdena med rektanglar. I diagrammet ovan motsvarar områdena för de tre staplarna som motsvarar fyra, fem och sex sannolikheten för att summan av våra tärningar är fyra, fem eller sex. Områdena för alla barer utgör totalt en.
I den normala normalfördelningen eller klockkurvan har vi en liknande situation. Området under kurvan mellan två z värden motsvarar sannolikheten för att vår variabel faller mellan dessa två värden. Till exempel området under klockkurvan för -1 z.
Det finns bokstavligen oändligt många sannolikhetsfördelningar. En lista över några av de viktigare distributionerna följer: