Vad är sammanfattningen av 5 nummer?

Det finns en mängd beskrivande statistik. Siffror som medelvärdet, median, läge, skevhet, kurtos, standardavvikelse, första kvartilen och tredje kvartilen, för att nämna några, berättar vart och ett om våra data. Istället för att titta på denna beskrivande statistik individuellt, ibland hjälper det att ge oss en fullständig bild genom att kombinera dem. Med tanke på detta är sammanfattningen av fem siffror ett bekvämt sätt att kombinera fem beskrivande statistik.

Vilka fem siffror?

Det är uppenbart att det ska finnas fem siffror i vår sammanfattning, men vilka fem? De valda siffrorna är för att hjälpa oss att veta mitten av våra data, liksom hur spridda datapunkterna är. Med detta i åtanke består sammanfattningen av fem siffror av följande:

  • Minimet - detta är det minsta värdet i vår datauppsättning.
  • Den första kvartilen - detta nummer betecknas Q1 och 25% av våra uppgifter faller under den första kvartilen.
  • Median - det är mittpunkten för uppgifterna. 50% av all data faller under medianen.
  • Den tredje kvartilen - detta nummer betecknas Q3 och 75% av våra uppgifter faller under den tredje kvartilen.
  • Det maximala - detta är det största värdet i vår datauppsättning.

Medel- och standardavvikelsen kan också användas tillsammans för att förmedla centrum och spridningen av en uppsättning data. Båda dessa statistik är emellertid mottagliga för outliers. Median, första kvartil och tredje kvartil är inte lika starkt påverkade av outliers.

Ett exempel

Med tanke på följande uppsättning data kommer vi att rapportera sammanfattningen av fem nummer:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Det finns totalt tjugo poäng i datasatsen. Medianen är således medelvärdet av det tionde och elfte datavärdet eller:

(7 + 8) / 2 = 7,5.

Median för den nedre halvan av data är den första kvartilen. Den nedre halvan är:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Således beräknar viQ1= (4 + 6) / 2 = 5.

Median för den övre halvan av den ursprungliga datauppsättningen är den tredje kvartilen. Vi måste hitta medianen av:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Således beräknar viQ3= (15 + 15) / 2 = 15.

Vi samlar alla ovanstående resultat tillsammans och rapporterar att sammanfattningen av fem siffror för ovanstående uppsättning data är 1, 5, 7.5, 12, 20.

Grafisk representation

Fem sammanfattningar kan jämföras med varandra. Vi kommer att upptäcka att två uppsättningar med liknande medel och standardavvikelser kan ha mycket olika femsummersammandrag. För att enkelt kunna jämföra två femsummeröversikter på ett ögonblick kan vi använda en ruta med en ruta eller en ruta och whiskers.