Care este distribuția binomială negativă?

Distribuția binomială negativă este o distribuție de probabilitate care este utilizată cu variabile aleatoare discrete. Acest tip de distribuție se referă la numărul de încercări care trebuie să aibă loc pentru a avea un număr predeterminat de succese. După cum vom vedea, distribuția binomială negativă este legată de distribuția binomială. În plus, această distribuție generalizează distribuția geometrică.

Setarea

Vom începe prin a privi atât setarea, cât și condițiile care dau naștere unei distribuții binomiale negative. Multe dintre aceste condiții sunt foarte similare cu o setare binomială.

  1. Avem un experiment Bernoulli. Aceasta înseamnă că fiecare proces pe care îl efectuăm are un succes și un eșec bine definite și că acestea sunt singurele rezultate.
  2. Probabilitatea succesului este constantă, indiferent de câte ori efectuăm experimentul. Notăm această probabilitate constantă cu a p.
  3. Experimentul se repetă pentru X procese independente, ceea ce înseamnă că rezultatul unui proces nu are efect asupra rezultatului unei proceduri ulterioare. 

Aceste trei condiții sunt identice cu cele dintr-o distribuție binomială. Diferența este că o variabilă aleatorie binomală are un număr fix de încercări n.  Singurele valori ale X sunt 0, 1, 2, ... , n, deci aceasta este o distribuție finită.

O distribuție binomială negativă se referă la numărul de încercări X asta trebuie să apară până când avem r succese. Numarul r este un număr întreg pe care îl alegem înainte de a începe efectuarea încercărilor noastre. Variabila aleatorie X este încă discret. Cu toate acestea, acum variabila aleatoare poate prelua valori ale X = r, r + 1, r + 2, ... Această variabilă aleatorie este infinit infinită, deoarece ar putea dura un timp în mod arbitrar înainte de a obține r succese.

Exemplu

Pentru a ajuta la sensul unei distribuții binomiale negative, merită să luăm în considerare un exemplu. Să presupunem că aruncăm o monedă corectă și ne punem întrebarea: „Care este probabilitatea să primim trei capete în prima X monedele flipsă? ”Aceasta este o situație care necesită o distribuție binomială negativă. 

Flipurile monedelor au două rezultate posibile, probabilitatea de reușită este constantă 1/2, iar încercările sunt independente unele de altele. Cerem probabilitatea de a primi primele trei capete după X monedele flip. Astfel, trebuie să aruncăm moneda de cel puțin trei ori. Apoi continuăm să râdem până când apare cel de-al treilea cap.

Pentru a calcula probabilitățile legate de o distribuție binomială negativă, avem nevoie de informații suplimentare. Trebuie să cunoaștem funcția masei probabilității.

Probabilitatea funcției de masă

Funcția de masă de probabilitate pentru o distribuție binomială negativă poate fi dezvoltată cu un pic de gândire. Fiecare proces are o probabilitate de succes dată de p.  Deoarece există doar două rezultate posibile, aceasta înseamnă că probabilitatea de eșec este constantă (1 - p ).

rsuccesul trebuie să apară pentru Xal treilea și ultimul proces. Anteriorul X - 1 încercări trebuie să conțină exact r - 1 succese. Numărul de moduri în care se poate produce acest lucru este dat de numărul de combinații:

C (X - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!]. 

În plus, avem evenimente independente și, astfel, ne putem multiplica probabilitățile împreună. Combinând toate acestea, obținem funcția de masă de probabilitate

f(X) = C (X - 1, r -1) pr(1 - p)X - r.

Numele distribuției

Acum suntem în poziția de a înțelege de ce această variabilă aleatoare are o distribuție binomială negativă. Numărul de combinații pe care le-am întâlnit mai sus poate fi scris diferit prin setare x - r = k:

(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1) (x + k - 2)… (r + 1) (r) /k! = (-1)k(-r) (- r - 1)… (-r - (k + 1) / k!.

Aici vedem aspectul unui coeficient binomial negativ, care este utilizat atunci când ridicăm o expresie binomială (a + b) la o putere negativă.

Rău

Media unei distribuții este importantă de știut, deoarece este o modalitate de a denota centrul distribuției. Media acestui tip de variabilă aleatorie este dată de valoarea preconizată și este egală cu r / p.  Putem dovedi acest lucru cu atenție folosind funcția de generare a momentului pentru această distribuție.

Intuiția ne ghidează și spre această expresie. Să presupunem că efectuăm o serie de încercări n1 până obținem r succese. Și atunci facem din nou asta, doar de data asta este nevoie n2 încercări. Continuăm acest lucru din nou, până când avem un număr mare de grupuri de încercări N = n1 + n+... +  nk.

Fiecare dintre acestea k încercările conțin r succese și astfel avem un total de kr succese. Dacă este mare, atunci ne-am aștepta să vedem despre np succese. Astfel, le echivalăm împreună și avem kr = Np.

Facem ceva algebră și găsim asta N / k = r / p.  Fracția din partea stângă a acestei ecuații este numărul mediu de încercări necesare pentru fiecare dintre noastre k grupuri de încercări. Cu alte cuvinte, acesta este numărul de așteptat de ori pentru a efectua experimentul, astfel încât să avem un total de r succese. Aceasta este exact așteptarea pe care dorim să o găsim. Vedem că aceasta este egală cu formula r / p.

variație

Varianța distribuției binomiale negative poate fi, de asemenea, calculată folosind funcția de generare a momentului. Când facem acest lucru, vedem variația acestei distribuții este dată de următoarea formulă:

r (1 - p) /p2

Funcția generatoare de moment

Funcția de generare a momentului pentru acest tip de variabilă aleatorie este destul de complicată. Reamintim că funcția de generare a momentului este definită a fi valoarea așteptată E [etX]. Folosind această definiție cu funcția noastră de masă de probabilitate, avem:

M (t) = E [etX] = Σ (x - 1)! / [(R - 1)! (x - r)!] EtXpr(1 - p)X - r

După o algebră, aceasta devine M (t) = (peT)r[1- (1- p) eT]-r

Relația cu alte distribuții

Am văzut mai sus cum distribuția binomială negativă este similară în multe feluri cu distribuția binomială. Pe lângă această conexiune, distribuția binomială negativă este o versiune mai generală a unei distribuții geometrice.  

O variabilă aleatoare geometrică X numără numărul de încercări necesare înainte de primul succes. Este ușor de observat că aceasta este exact distribuția binomială negativă, dar cu r egală cu una.

Există și alte formulări ale distribuției binomiale negative. Unele manuale definesc X să fie numărul de încercări până r apar erori.

Exemplu problemă

Vom analiza o problemă de exemplu pentru a vedea cum să funcționăm cu distribuția binomială negativă. Să presupunem că un jucător de baschet este un trăgător cu aruncări de 80%. Mai mult, presupunem că a face o singură aruncare liberă este independentă de a face următoarea. Care este probabilitatea ca pentru acest jucător cel de-al optulea coș să fie făcut la a zecea aruncare liberă?

Vedem că avem o setare pentru o distribuție binomială negativă. Probabilitatea constantă de reușită este 0,8, deci probabilitatea de eșec este 0,2. Vrem să determinăm probabilitatea X = 10 când r = 8.

Conectăm aceste valori la funcția noastră de masă de probabilitate:

f (10) = C (10 -1, 8 - 1) (0,8)8(0,2)2= 36 (0,8)8(0,2)2, care este de aproximativ 24%.

Am putea apoi să ne întrebăm care este numărul mediu de aruncări libere înainte ca acest jucător să facă opt dintre acestea. Deoarece valoarea așteptată este 8 / 0.8 = 10, acesta este numărul de fotografii.