Explorați exemple de estimare a probabilității maxime

Să presupunem că avem un eșantion aleatoriu de la o populație de interes. Este posibil să avem un model teoretic pentru modul în care populația este distribuită. Cu toate acestea, pot exista mai mulți parametri ai populației, dintre care nu cunoaștem valorile. Estimarea probabilității maxime este o modalitate de a determina acești parametri necunoscuți. 

Ideea de bază din spatele estimării probabilității maxime este că determinăm valorile acestor parametri necunoscuți. Facem acest lucru în așa fel încât să maximizăm o funcție asociată de densitate de probabilitate sau funcție de masă de probabilitate. Vom vedea acest lucru mai detaliat în ceea ce urmează. Apoi vom calcula câteva exemple de estimare a probabilității maxime.

Pași pentru estimarea probabilității maxime

Discuția de mai sus poate fi rezumată prin următorii pași:

  1. Începeți cu un eșantion de variabile X aleatoare independente1, X2,… Xn dintr-o distribuție comună fiecare cu funcția de densitate de probabilitate f (x; θ1,... θk). Tezele sunt parametri necunoscuți.
  2. Deoarece eșantionul nostru este independent, probabilitatea obținerii eșantionului specific pe care îl observăm se găsește prin înmulțirea probabilităților noastre împreună. Aceasta ne oferă o funcție de probabilitate L (θ)1,... θk) = F (x1 ; θ1,... θk) f (x2 ; θ1,... θk) ... f (xn ; θ1,... θk) = Π f (xeu ; θ1,... θk).
  3. În continuare, folosim Calculul pentru a găsi valorile theta care maximizează funcția noastră de probabilitate L. 
  4. Mai precis, diferențiem funcția de probabilitate L față de θ dacă există un singur parametru. Dacă există mai mulți parametri, calculăm derivate parțiale ale L în raport cu fiecare dintre parametrii theta.
  5. Pentru a continua procesul de maximizare, setați derivata L (sau derivate parțiale) egală cu zero și rezolvați pentru theta.
  6. Putem folosi apoi alte tehnici (cum ar fi un al doilea test derivat) pentru a verifica dacă am găsit un maxim pentru funcția noastră de probabilitate.

Exemplu

Să presupunem că avem un pachet de semințe, fiecare având o probabilitate constantă p de succes al germinării. Plantăm n dintre acestea și numărați cei care încolțesc. Presupunem că fiecare sămânță încolțește independent de celelalte. Cum determinăm estimatorul de probabilitate maximă a parametrului p?

Începem prin a observa că fiecare sămânță este modelată de o distribuție Bernoulli cu un succes de p. Noi lăsăm X fie 0 sau 1, iar funcția de probabilitate a masei pentru o singură sămânță este f( X ; p ) = pX (1 - p)1 - x

Eșantionul nostru este format din n  diferit Xeu, fiecare dintre ele are o distribuție Bernoulli. Semințele care au încolțit au Xeu = 1 și semințele care nu reușesc să încolțească au Xeu = 0. 

Funcția de probabilitate este dată de:

L ( p ) = Π pXeu (1 - p)1 - Xeu

Vedem că este posibil să rescrieți funcția de probabilitate folosind legile exponenților. 

L ( p ) = pΣ xeu (1 - p)n - Σ xeu

În continuare diferențiem această funcție în raport cu p. Presupunem că valorile pentru toate Xeu sunt cunoscute și, prin urmare, sunt constante. Pentru a diferenția funcția de probabilitate, trebuie să utilizăm regula produsului împreună cu regula de alimentare:

L '( p ) = Σ xeup-1 + Σ xeu (1 - p)n - Σ xeu - (n - Σ xeu ) pΣ xeu (1 - p)n-1 - Σ xeu

Rescriem unii dintre exponenții negativi și avem:

L '( p ) = (1 /p) Σ xeupΣ xeu (1 - p)n - Σ xeu - 1 / (1 - p) (n - Σ xeu ) pΣ xeu (1 - p)n - Σ xeu

= [(1 /p) Σ xeu - 1 / (1 - p) (n - Σ xeu)]eupΣ xeu (1 - p)n - Σ xeu

Acum, pentru a continua procesul de maximizare, setăm această derivată egală cu zero și rezolvăm pentru p:

0 = [(1 /p) Σ xeu - 1 / (1 - p) (n - Σ xeu)]eupΣ xeu (1 - p)n - Σ xeu

De cand p și (1- p) sunt non-zero avem asta

0 = (1 /p) Σ xeu - 1 / (1 - p) (n - Σ xeu).

Înmulțirea ambelor părți ale ecuației cu p(1- p) ne ofera:

0 = (1 - p) Σ xeu - p (n - Σ xeu).

Extindem partea dreaptă și vedem:

0 = Σ xeu - p Σ xeu - p n + pΣ xeu = Σ xeu - p n.

Astfel Σ xeu = p n și (1 / n) Σ xeu = p. Aceasta înseamnă că estimatorul probabilității maxime a p este o medie a eșantionului. Mai exact aceasta este proporția de probă a semințelor care au germinat. Acest lucru este perfect în conformitate cu ceea ce ne-ar spune intuiția. Pentru a determina proporția de semințe care vor germina, luați în considerare mai întâi un eșantion din populația de interes.

Modificări la pași

Există câteva modificări ale listei de pași de mai sus. De exemplu, așa cum am văzut mai sus, este în mod obișnuit să merită să petrecem ceva timp folosind o anumită algebră pentru a simplifica expresia funcției de probabilitate. Motivul pentru aceasta este de a facilita diferențierea.

O altă modificare a listei de pași de mai sus este luarea în considerare a logaritmelor naturale. Maximul pentru funcția L va apărea în același punct ca și pentru logaritmul natural al L. Astfel maximizarea ln L este echivalentă cu maximizarea funcției L.

De multe ori, datorită prezenței funcțiilor exponențiale în L, luarea logaritmului natural al lui L va simplifica foarte mult o parte din munca noastră.

Exemplu

Vedem cum să utilizăm logaritmul natural revizuind exemplul de mai sus. Începem cu funcția de probabilitate:

L ( p ) = pΣ xeu (1 - p)n - Σ xeu .

Ne folosim apoi legile logaritmului și vedem că:

R ( p ) = ln L ( p ) = Σ xeu ln p + (n - Σ xeu) ln (1 - p).

Vedem deja că derivatul este mult mai ușor de calculat:

R '( p ) = (1 /p) Σ xeu - 1 / (1 - p) (n - Σ xeu) .

Acum, ca și înainte, setăm acest derivat egal cu zero și înmulțim ambele părți cu p (1 - p):

0 = (1- p ) Σ xeu p(n - Σ xeu) .

Rezolvăm pentru p și găsiți același rezultat ca înainte.

Utilizarea logaritmului natural al lui L (p) este utilă într-un alt mod. Este mult mai ușor să calculăm a doua derivată a lui R (p) pentru a verifica dacă avem cu adevărat un maxim la punctul (1 / n) Σ xeu = p.

Exemplu

Pentru un alt exemplu, să presupunem că avem un eșantion X aleatoriu1, X2,… Xn dintr-o populație pe care o modelăm cu o distribuție exponențială. Densitatea probabilității pentru o variabilă aleatorie este de formă f( X ) = θ-1 e -X/ θ

Funcția de probabilitate este dată de funcția de densitate a probabilității comune. Acesta este un produs al mai multor dintre aceste funcții de densitate:

L (θ) = Π θ-1 e -Xeu/ θ = θ-n e Xeu/ θ

Încă o dată este util să luăm în considerare logaritmul natural al funcției de probabilitate. Diferențierea acestui lucru va necesita mai puțin de lucru decât diferențierea funcției de probabilitate:

R (θ) = ln L (θ) = ln [θ-n e Xeu/ θ]

Ne folosim legile logaritmelor și obținem:

R (θ) = ln L (θ) = - n Este n θ + -ΣXeu/ θ

Diferențiem în raport cu θ și avem:

R '(θ) = - n / θ + ΣXeu/ θ2

Setați această derivată egală cu zero și vedem că:

0 = - n / θ + ΣXeu/ θ2.

Înmulțiți ambele părți cu θ2 iar rezultatul este:

0 = - n θ + ΣXeu.

Acum folosiți algebra pentru a rezolva pentru θ:

θ = (1 / n) ΣXeu.

Vom vedea de aici că media eșantionului este ceea ce maximizează funcția de probabilitate. Parametrul θ care să se potrivească modelului nostru ar trebui să fie pur și simplu media tuturor observațiilor noastre.

Conexiuni

Există și alte tipuri de estimatori. Un tip alternativ de estimare este numit estimator nepărtinitor. Pentru acest tip, trebuie să calculăm valoarea așteptată a statisticii noastre și să stabilim dacă se potrivește cu un parametru corespunzător.