Hur man använder den normala tillnärmningen till en binomial distribution

Binomialfördelningen innefattar en diskret slumpmässig variabel. Sannolikheter i en binomiell inställning kan beräknas på ett enkelt sätt genom att använda formeln för en binomialkoefficient. Även om det i teorin är en enkel beräkning, kan det i praktiken bli ganska tråkigt eller till och med beräkningsmässigt omöjligt att beräkna binomiala sannolikheter. Dessa problem kan undvikas genom att istället använda en normal distribution för att ungefärliga en binomial distribution. Vi kommer att se hur vi gör detta genom att gå igenom stegen i en beräkning.

Steg för att använda den normala tillnärmningen

Först måste vi avgöra om det är lämpligt att använda den normala tillnärmningen. Inte varje binomialfördelning är densamma. Vissa har tillräckligt snedighet att vi inte kan använda en normal tillnärmning. För att kontrollera om den normala tillnärmningen ska användas måste vi titta på värdet på p, vilket är sannolikheten för framgång och n, vilket är antalet observationer av vår binomialvariabel.

För att använda den normala tillnärmningen överväger vi båda np och n(1 - p ). Om båda dessa nummer är större än eller lika med 10, är vi berättigade att använda den normala tillnärmningen. Detta är en allmän tumregel och vanligtvis desto större värden på np och n(1 - p ), desto bättre är approximationen.

Jämförelse mellan binomial och normal

Vi kommer att jämföra en exakt binomial sannolikhet med den som erhålls genom en normal approximation. Vi överväger att kasta 20 mynt och vill veta sannolikheten för att fem mynt eller mindre var huvuden. Om X är antalet huvuden, då vill vi hitta värdet:

P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5).

Användningen av binomialformeln för var och en av dessa sex sannolikheter visar oss att sannolikheten är 2.0695%. Vi kommer nu att se hur nära vår normala tillnärmning kommer att vara detta värde.

När vi kontrollerar villkoren ser vi att båda np och np(1 - p) är lika med 10. Detta visar att vi kan använda den normala tillnärmningen i detta fall. Vi kommer att använda en normalfördelning med medelvärde av np = 20 (0,5) = 10 och en standardavvikelse av (20 (0,5) (0,5))^0,5 = 2,236.

För att bestämma sannolikheten för att X är mindre än eller lika med 5 vi behöver för att hitta z-poäng för 5 i normalfördelningen som vi använder. Således z = (5 - 10) /2.236 = -2.236. Genom att konsultera en tabell över z-poäng vi ser att sannolikheten för att z är mindre än eller lika med -2.236 är 1.267%. Detta skiljer sig från den faktiska sannolikheten men ligger inom 0,8%.

Kontinuitetskorrigeringsfaktor

För att förbättra vår uppskattning är det lämpligt att införa en kontinuitetskorrigeringsfaktor. Detta används eftersom en normalfördelning är kontinuerlig medan binomialfördelningen är diskret. För en binomiell slumpvariabel, ett sannolikhetshistogram för X = 5 kommer att innehålla en bar som går från 4,5 till 5,5 och är centrerad vid 5.

Detta betyder att för ovanstående exempel är sannolikheten för att X är mindre än eller lika med 5 för en binomvariabel bör uppskattas med sannolikheten för att X är mindre än eller lika med 5,5 för en kontinuerlig normalvariabel. Således z = (5,5 - 10) /2,236 = -2,013. Sannolikheten för att z

Vetenskap