Definition av Bimodal i statistik

En datamängd är bimodal om den har två lägen. Detta innebär att det inte finns ett enda datavärde som uppstår med den högsta frekvensen. Istället finns det två datavärden som gör det möjligt att ha den högsta frekvensen.

Exempel på en Bimodal Data Set

För att hjälpa till att förstå denna definition kommer vi att titta på ett exempel på en uppsättning med ett läge och kontrastera sedan detta med en bimodal datauppsättning. Anta att vi har följande uppsättning data:

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10

Vi räknar frekvensen för varje nummer i datauppsättningen:

  • 1 inträffar i uppsättningen tre gånger
  • 2 inträffar i uppsättningen fyra gånger
  • 3 inträffar i uppsättningen en gång
  • 4 inträffar i inställd en gång
  • 5 inträffar i uppsättningen två gånger
  • 6 inträffar i uppsättningen tre gånger
  • 7 inträffar i uppsättningen tre gånger
  • 8 inträffar i inställningen en gång
  • 9 inträffar i inställda noll gånger
  • 10 inträffar i uppsättningen två gånger

Här ser vi att 2 förekommer oftast, och det är därför läget för datauppsättningen. 

Vi kontrasterar detta exempel till följande

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10

Vi räknar frekvensen för varje nummer i datauppsättningen:

  • 1 inträffar i uppsättningen tre gånger
  • 2 inträffar i uppsättningen fyra gånger
  • 3 inträffar i uppsättningen en gång
  • 4 inträffar i inställd en gång
  • 5 inträffar i uppsättningen två gånger
  • 6 inträffar i uppsättningen tre gånger
  • 7 inträffar i uppsättningen fem gånger
  • 8 inträffar i inställningen en gång
  • 9 inträffar i inställda noll gånger
  • 10 inträffar i uppsättningen fem gånger

Här förekommer 7 och 10 fem gånger. Detta är högre än något av de andra datavärdena. Således säger vi att datamängden är bimodal, vilket betyder att den har två lägen. Alla exempel på en bimodal dataset kommer att likna detta.

Implikationer av en Bimodal distribution

Läget är ett sätt att mäta centrum för en uppsättning data. Ibland är det genomsnittliga värdet för en variabel det som förekommer oftast. Av detta skäl är det viktigt att se om en datauppsättning är bimodal. I stället för ett enda läge skulle vi ha två.

En viktig implikation av en bimodal datamängd är att den kan avslöja för oss att det finns två olika typer av individer som representeras i en datamängd. Ett histogram av en bimodal datamängd kommer att uppvisa två toppar eller pinnar.

Till exempel kommer ett histogram av testresultat som är bimodalt att ha två toppar. Dessa toppar kommer att motsvara var den högsta frekvensen för eleverna fick poäng. Om det finns två lägen, kan det visa att det finns två typer av studenter: de som var förberedda för testet och de som inte var förberedda.