Slumpmässiga variabler med en binomialfördelning är kända för att vara diskreta. Detta innebär att det finns ett antal antal utfall som kan uppstå i en binomialfördelning, med skillnad mellan dessa resultat. En binomvariabel kan till exempel ta ett värde på tre eller fyra, men inte ett tal mellan tre och fyra.
Med den diskreta karaktären hos en binomialfördelning är det något förvånande att en kontinuerlig slumpmässig variabel kan användas för att ungefärliga en binomialfördelning. För många binomiala fördelningar kan vi använda en normalfördelning för att ungefärliga våra binomiala sannolikheter.
Detta kan ses när man tittar på n mynt kastar och låter X vara antalet huvuden. I denna situation har vi en binomial fördelning med sannolikhet för framgång som p = 0,5. När vi ökar antalet kastar ser vi att sannolikhetshistogrammet har större och större likhet med en normalfördelning.
Varje normalfördelning definieras fullständigt av två verkliga siffror. Dessa siffror är medelvärdet, som mäter distributionens centrum, och standardavvikelsen, som mäter spridningen av distributionen. För en given binomial situation måste vi kunna avgöra vilken normalfördelning vi ska använda.
Valet av rätt normalfördelning bestäms av antalet försök n i binomial inställning och konstant sannolikhet för framgång p för var och en av dessa försök. Den normala approximationen för vår binomialvariabel är ett medelvärde för np och en standardavvikelse av (np(1 - p)0,5.
Antag till exempel att vi gissade på var och en av de 100 frågorna i ett flervalsprov, där varje fråga hade ett korrekt svar av fyra val. Antalet korrekta svar X är en binomiell slumpvariabel med n = 100 och p = 0,25. Således har denna slumpmässiga variabel medelvärde på 100 (0,25) = 25 och en standardavvikelse på (100 (0,25) (0,75))0,5 = 4,33. En normalfördelning med medelvärde 25 och standardavvikelse 4,33 kommer att arbeta för att ungefärlig denna binomialfördelning.
Genom att använda viss matematik kan det visas att det finns några villkor som vi behöver för att använda en normal tillnärmning till binomialfördelningen. Antalet observationer n måste vara tillräckligt stort och värdet på p så att båda np och n(1 - p) är större än eller lika med 10. Detta är en tumregel som styrs av statistisk praxis. Den normala tillnärmningen kan alltid användas, men om dessa villkor inte är uppfyllda kan det hända att tillnärmningen inte är så bra med en tillnärmning.
Till exempel om n = 100 och p = 0,25, då är vi berättigade att använda den normala tillnärmningen. Det här är för att np = 25 och n(1 - p) = 75. Eftersom båda dessa siffror är större än 10 kommer lämplig normalfördelning att göra ett ganska bra jobb med att uppskatta binomiala sannolikheter.
Binomiala sannolikheter beräknas med hjälp av en mycket enkel formel för att hitta den binomiala koefficienten. Tyvärr, på grund av fabrikerna i formeln, kan det vara mycket enkelt att stöta på beräkningssvårigheter med binomialformeln. Den normala tillnärmningen tillåter oss att kringgå alla dessa problem genom att arbeta med en välkänd vän, en tabell över värden för en vanlig normalfördelning.
Många gånger är det tråkigt att beräkna en sannolikhet för att en binomiell slumpvariabel faller inom ett värden. Detta beror på att finna sannolikheten för att en binomialvariabel X är större än 3 och mindre än 10, skulle vi behöva hitta sannolikheten för att X är lika med 4, 5, 6, 7, 8 och 9 och lägg sedan till alla dessa sannolikheter tillsammans. Om den normala tillnärmningen kan användas, måste vi istället bestämma z-poäng som motsvarar 3 och 10, och sedan använda en z-poängtabell över sannolikheter för standard normalfördelning.