En datamängd är bimodal om den har två lägen. Detta innebär att det inte finns ett enda datavärde som uppstår med den högsta frekvensen. Istället finns det två datavärden som gör det möjligt att ha den högsta frekvensen.
För att hjälpa till att förstå denna definition kommer vi att titta på ett exempel på en uppsättning med ett läge och kontrastera sedan detta med en bimodal datauppsättning. Anta att vi har följande uppsättning data:
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10
Vi räknar frekvensen för varje nummer i datauppsättningen:
Här ser vi att 2 förekommer oftast, och det är därför läget för datauppsättningen.
Vi kontrasterar detta exempel till följande
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10
Vi räknar frekvensen för varje nummer i datauppsättningen:
Här förekommer 7 och 10 fem gånger. Detta är högre än något av de andra datavärdena. Således säger vi att datamängden är bimodal, vilket betyder att den har två lägen. Alla exempel på en bimodal dataset kommer att likna detta.
Läget är ett sätt att mäta centrum för en uppsättning data. Ibland är det genomsnittliga värdet för en variabel det som förekommer oftast. Av detta skäl är det viktigt att se om en datauppsättning är bimodal. I stället för ett enda läge skulle vi ha två.
En viktig implikation av en bimodal datamängd är att den kan avslöja för oss att det finns två olika typer av individer som representeras i en datamängd. Ett histogram av en bimodal datamängd kommer att uppvisa två toppar eller pinnar.
Till exempel kommer ett histogram av testresultat som är bimodalt att ha två toppar. Dessa toppar kommer att motsvara var den högsta frekvensen för eleverna fick poäng. Om det finns två lägen, kan det visa att det finns två typer av studenter: de som var förberedda för testet och de som inte var förberedda.