Ett histogram är en typ av graf som har stora tillämpningar i statistik. Histogram ger en visuell tolkning av numeriska data genom att ange antalet datapunkter som ligger inom ett värdevärde. Dessa värden intervall kallas klasser eller fack. Frekvensen för data som faller i varje klass visas av en bar. Ju högre fältet är, desto större är frekvensen av datavärden i facket.
Vid första anblicken ser histogram väldigt lika ut som stapeldiagram. Båda graferna använder vertikala staplar för att representera data. En barns höjd motsvarar den relativa frekvensen för datamängden i klassen. Ju högre stapel, desto högre frekvens för data. Ju lägre stapel, desto lägre datafrekvens. Men utseende kan lura. Det är här som likheterna slutar mellan de två sorters grafer.
Anledningen till att dessa typer av diagram är olika har att göra med mätnivån för data. Å ena sidan används stapeldiagram för data på den nominella mätningsnivån. Stapeldiagram mäter frekvensen för kategoriska data, och klasserna för ett stapeldiagram är dessa kategorier. Å andra sidan används histogram för data som är åtminstone på den ordinära mätnivån. Klasserna för ett histogram är värden.
En annan viktig skillnad mellan stapeldiagram och histogram har att göra med beställningen av staplarna. I ett stapeldiagram är det vanligt att ordna stängerna i följd av minskande höjd. Emellertid kan staplarna i ett histogram inte ordnas om. De måste visas i den ordning klasserna inträffar.
Diagrammet ovan visar oss ett histogram. Anta att fyra mynt vänds och resultaten registreras. Användningen av lämplig binomial fördelningstabell eller enkla beräkningar med binomialformeln visar sannolikheten att inga huvuden visar är 1/16, sannolikheten för att ett huvud visar är 4/16. Sannolikheten för två huvuden är 6/16. Sannolikheten för tre huvuden är 4/16. Sannolikheten för fyra huvuden är 1/16.
Vi konstruerar totalt fem klasser, vardera med bredd en. Dessa klasser motsvarar antalet möjliga huvuden: noll, en, två, tre eller fyra. Ovanför varje klass ritar vi en vertikal stapel eller rektangel. Höjden på dessa staplar motsvarar de sannolikheter som nämns för vårt sannolikhetsexperiment att vända fyra mynt och räkna huvuden.
Ovanstående exempel visar inte bara konstruktionen av ett histogram, utan visar också att diskreta sannolikhetsfördelningar kan representeras med ett histogram. Faktum är att och diskret sannolikhetsfördelning kan representeras av ett histogram.
För att konstruera ett histogram som representerar en sannolikhetsfördelning, börjar vi med att välja klasserna. Dessa bör vara resultatet av ett sannolikhetsexperiment. Bredden på var och en av dessa klasser bör vara en enhet. Höjderna på staplarna i histogrammet är sannolikheten för vart och ett av resultaten. Med ett histogram konstruerat på ett sådant sätt är områdena i staplarna också troliga.
Eftersom den här typen av histogram ger oss sannolikheter är det föremål för ett par villkor. En bestämmelse är att endast icke-negativa siffror kan användas för den skala som ger oss höjden på en given stapel i histogrammet. Ett andra villkor är att eftersom sannolikheten är lika med området måste alla områden på stängerna lägga till totalt en, motsvarande 100%.
Stängerna i ett histogram behöver inte vara troliga. Histogram är användbara på andra områden än sannolikhet. När som helst vi vill jämföra frekvensen av förekomst av kvantitativa data som ett histogram kan använda för att skildra vår datamängd.