Den negativa binomialfördelningen är en sannolikhetsfördelning som används med diskreta slumpmässiga variabler. Denna typ av distribution gäller antalet försök som måste ske för att ha ett förutbestämt antal framgångar. Som vi ser är den negativa binomialfördelningen relaterad till binomialfördelningen. Dessutom generaliserar denna distribution den geometriska fördelningen.
Vi börjar med att titta på både inställningen och förhållandena som ger upphov till en negativ binomialfördelning. Många av dessa förhållanden liknar en binomial inställning.
Dessa tre förhållanden är identiska med dem i en binomialfördelning. Skillnaden är att en binomiell slumpvariabel har ett fast antal försök n. De enda värdena på X är 0, 1, 2, ... , n, så detta är en ändlig distribution.
En negativ binomialfördelning avser antalet försök X som måste ske tills vi har gjort det r framgångar. Numret r är ett helt antal som vi väljer innan vi börjar utföra våra försök. Den slumpmässiga variabeln X är fortfarande diskret. Men nu kan den slumpmässiga variabeln ta värden på X = r, r + 1, r + 2, ... Denna slumpmässiga variabel är oändligt, eftersom det kan ta godtyckligt lång tid innan vi får r framgångar.
För att hjälpa till att känna till en negativ binomialfördelning är det värt att överväga ett exempel. Anta att vi vänder ett rättvist mynt och vi ställer frågan, "Vad är sannolikheten för att vi får tre huvuden i det första X mynt vänder? "Detta är en situation som kräver en negativ binomial distribution.
Myntflikarna har två möjliga resultat, sannolikheten för framgång är en konstant 1/2 och försöken är de oberoende av varandra. Vi ber om sannolikheten att få de tre första huvuden efter X mynt vänder. Därför måste vi vända myntet minst tre gånger. Vi fortsätter sedan att vända tills det tredje huvudet visas.
För att beräkna sannolikheter relaterade till en negativ binomialfördelning behöver vi lite mer information. Vi måste veta sannolikheten för massfunktionen.
Sannolikmassfunktionen för en negativ binomialfördelning kan utvecklas med lite tanke. Varje försök har en sannolikhet för framgång som ges av p. Eftersom det bara finns två möjliga resultat, betyder detta att sannolikheten för misslyckande är konstant (1 - p ).
De rframgång måste ske för xth och sista rättegången. Den förra x - 1 försök måste innehålla exakt r - 1 framgångar. Antalet sätt som detta kan ske med antalet kombinationer:
C (x - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!].
Utöver detta har vi oberoende händelser, och så kan vi multiplicera våra sannolikheter tillsammans. Genom att sammanföra allt detta får vi sannolikhetsmassafunktionen
f(x) = C (x - 1, r -1) pr(1 - p)x - r.
Vi kan nu förstå varför denna slumpmässiga variabel har en negativ binomialfördelning. Antalet kombinationer som vi stött på ovan kan skrivas annorlunda genom att ställa in x - r = k:
(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1) (x + k - 2) ... (r + 1) (r) /k! = (-1)k(-r) (- r - 1) ... (-r - (k + 1) / k!.
Här ser vi utseendet på en negativ binomialkoefficient, som används när vi höjer ett binomialt uttryck (a + b) till en negativ effekt.
Medelvärdet för en distribution är viktigt att veta eftersom det är ett sätt att beteckna distributionens centrum. Medlet för denna typ av slumpmässig variabel ges av dess förväntade värde och är lika med r / p. Vi kan bevisa detta noggrant genom att använda den momentgenererande funktionen för denna distribution.
Intuition leder oss också till detta uttryck. Anta att vi utför en serie försök n1 tills vi får r framgångar. Och sedan gör vi det igen, bara den här gången det tar n2 prövningar. Vi fortsätter detta om och om igen, tills vi har ett stort antal grupper av försök N = n1 + n2 +... + nk.
Var och en av de här k försök innehåller r framgångar, och så har vi totalt kr framgångar. Om N är stor, då skulle vi förvänta oss att se om Np framgångar. Således liknar vi dessa och har kr = Np.
Vi gör algebra och finner det N / k = r / p. Fraktionen på vänster sida av denna ekvation är det genomsnittliga antalet försök som krävs för var och en av våra k grupper av försök. Med andra ord, detta är det förväntade antalet gånger för att utföra experimentet så att vi har totalt r framgångar. Det är exakt den förväntan som vi vill hitta. Vi ser att detta är lika med formeln r / p.
Variationen för den negativa binomialfördelningen kan också beräknas med hjälp av den momentgenererande funktionen. När vi gör detta ser vi att fördelningen av denna distribution ges med följande formel:
r (1 - p) /p2
Den momentgenererande funktionen för denna typ av slumpmässig variabel är ganska komplicerad. Kom ihåg att den momentgenererande funktionen definieras som det förväntade värdet E [etX]. Genom att använda denna definition med vår sannolikhetsmassafunktion har vi:
M (t) = E [etX] = Σ (x - 1)! / [(R - 1)! (x - r)!] EtXpr(1 - p)x - r
Efter en del algebra blir detta M (t) = (pet)r[1- (1- p) et]-r
Vi har sett ovan hur den negativa binomialfördelningen på många sätt liknar den binomiala fördelningen. Utöver denna anslutning är den negativa binomialfördelningen en mer allmän version av en geometrisk fördelning.
En geometrisk slumpmässig variabel X räknar antalet försök som krävs innan den första framgången inträffar. Det är lätt att se att det är exakt den negativa binomialfördelningen, men med r lika med en.
Andra formuleringar av den negativa binomialfördelningen finns. Vissa läroböcker definierar X att vara antalet försök fram till r misslyckanden uppstår.
Vi kommer att titta på ett exempelproblem för att se hur man arbetar med negativ binomialfördelning. Anta att en basketbollsspelare är en 80% frikast. Anta vidare att att göra ett frikast är oberoende av att göra nästa. Vad är troligt att den åttonde korgen för den här spelaren görs på det tionde frikastet?
Vi ser att vi har en inställning för en negativ binomialfördelning. Den konstanta sannolikheten för framgång är 0,8, och därför är sannolikheten för misslyckande 0,2. Vi vill bestämma sannolikheten för X = 10 när r = 8.
Vi ansluter dessa värden till vår sannolikhetsmassafunktion:
f (10) = C (10-1, 8 - 1) (0,8)8(0,2)2= 36 (0,8)8(0,2)2, vilket är ungefär 24%.
Vi skulle då kunna fråga vad som är det genomsnittliga antalet gratiska kast innan den här spelaren gör åtta av dem. Eftersom det förväntade värdet är 8 / 0,8 = 10, är detta antalet bilder.