Vad är Chebysjevs ojämlikhet?

Chebysjevs ojämlikhet säger att minst 1-1 /K2 av data från ett prov måste falla inom K standardavvikelser från medelvärdet (här K är något positivt reellt antal större än ett).

Varje datauppsättning som normalt distribueras eller i form av en klockkurva har flera funktioner. En av dem handlar om spridningen av uppgifterna relativt antalet standardavvikelser från medelvärdet. I en normalfördelning vet vi att 68% av uppgifterna är en standardavvikelse från medelvärdet, 95% är två standardavvikelser från medelvärdet och cirka 99% ligger inom tre standardavvikelser från medelvärdet.

Men om datauppsättningen inte distribueras i form av en klockkurva, kan en annan mängd vara inom en standardavvikelse. Chebysjevs ojämlikhet ger ett sätt att veta vilken bråkdel av data som faller inom K standardavvikelser från medelvärdet för några datauppsättning.

Fakta om ojämlikheten

Vi kan också ange ojämlikheten ovan genom att ersätta frasen "data från ett prov" med sannolikhetsfördelning. Detta beror på att Chebyshevs ojämlikhet är ett resultat av sannolikhet, som sedan kan tillämpas på statistik.

Det är viktigt att notera att denna ojämlikhet är ett resultat som har bevisats matematiskt. Det är inte som det empiriska förhållandet mellan medelvärdet och läget eller tumregeln som förbinder intervallet och standardavvikelsen.

Illustration av ojämlikheten

För att illustrera ojämlikheten kommer vi att titta på den för några värden K:

  • För K = 2 vi har 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Så Chebyshevs ojämlikhet säger att minst 75% av datavärdena för någon distribution måste ligga inom två standardavvikelser från medelvärdet.
  • För K = 3 vi har 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Så Chebyshevs ojämlikhet säger att minst 89% av datavärdena för någon distribution måste ligga inom tre standardavvikelser från medelvärdet.
  • För K = 4 vi har 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93,75%. Så Chebyshevs ojämlikhet säger att minst 93,75% av datavärdena för någon distribution måste ligga inom två standardavvikelser från medelvärdet.

Exempel

Anta att vi har tagit prov på hundarnas vikter i det lokala djurskyddet och funnit att vårt prov har ett medelvärde på 20 kilo med en standardavvikelse på 3 pund. Med användning av Chebyshevs ojämlikhet vet vi att minst 75% av de hundar som vi provade har vikter som är två standardavvikelser från medelvärdet. Två gånger standardavvikelsen ger oss 2 x 3 = 6. Dra bort och lägg till detta från medelvärdet av 20. Detta säger att 75% av hundarna har vikt från 14 till 26 pund.

Användning av ojämlikheten

Om vi ​​vet mer om distributionen som vi arbetar med, kan vi vanligtvis garantera att mer data är ett visst antal standardavvikelser från medelvärdet. Om vi ​​till exempel vet att vi har en normalfördelning är 95% av uppgifterna två standardavvikelser från medelvärdet. Chebysjevs ojämlikhet säger att i denna situation vet vi det minst 75% av uppgifterna är två standardavvikelser från medelvärdet. Som vi ser i det här fallet kan det vara mycket mer än 75%.

Värdet på ojämlikheten är att det ger oss ett "värre fall" -scenario där det enda vi vet om våra provdata (eller sannolikhetsfördelning) är medelvärdet och standardavvikelsen. När vi inte vet något annat om våra data ger Chebyshevs ojämlikhet en viss ytterligare inblick i hur spridningen av datamängden är.

Ojämlikhetens historia

Ojämlikheten är uppkallad efter den ryska matematikern Pafnuty Chebyshev, som först uttalade ojämlikheten utan bevis 1874. Tio år senare bevisades ojämlikheten av Markov i sin doktorsexamen. avhandling. På grund av skillnader i hur man representerar det ryska alfabetet på engelska är det Chebyshev också stavat som Tchebysheff.