Distribuția probabilității în statistici

Dacă petreci mult timp cu toate statisticile, destul de curând vei intra în sintagma „distribuția probabilităților”. Aici vom ajunge să vedem cât de mult se suprapun zonele de probabilitate și statistici. Deși acest lucru poate părea ceva tehnic, fraza distribuției probabilităților este într-adevăr doar un mod de a vorbi despre organizarea unei liste de probabilități. O distribuție de probabilitate este o funcție sau o regulă care atribuie probabilități fiecărei valori a unei variabile aleatorii. În unele cazuri, distribuția poate fi listată. În alte cazuri, este prezentat sub forma unui grafic.

Exemplu

Să presupunem că rulăm două zaruri și apoi înregistrăm suma zarurilor. Sunt posibile sume oriunde între două și 12 ani. Fiecare sumă are o probabilitate particulară de apariție. Putem enumera pur și simplu următoarele:

  • Suma de 2 are o probabilitate de 1/36
  • Suma de 3 are o probabilitate de 2/36
  • Suma de 4 are o probabilitate de 3/36
  • Suma de 5 are o probabilitate de 4/36
  • Suma de 6 are o probabilitate de 5/36
  • Suma de 7 are o probabilitate de 6/36
  • Suma de 8 are o probabilitate de 5/36
  • Suma de 9 are o probabilitate de 4/36
  • Suma de 10 are o probabilitate de 3/36
  • Suma de 11 are o probabilitate de 2/36
  • Suma de 12 are o probabilitate de 1/36

Această listă este o distribuție a probabilităților pentru experimentul de probabilitate de rulare a două zaruri. Putem considera, de asemenea, cele de mai sus ca o distribuție a probabilității variabilei aleatoare definită prin examinarea sumei celor două zaruri.

Grafic

O distribuție de probabilitate poate fi grapied, iar uneori acest lucru ajută să ne arate caracteristici ale distribuției care nu erau evidente doar din citirea listei de probabilități. Variabila aleatorie este reprezentată de-a lungul X-axa, iar probabilitatea corespunzătoare este reprezentată de-a lungul y-axă. Pentru o variabilă aleatorie discretă, vom avea o histogramă. Pentru o variabilă aleatorie continuă, vom avea interiorul unei curbe netede.

Normele probabilității sunt încă în vigoare și se manifestă în câteva feluri. Deoarece probabilitățile sunt mai mari sau egale cu zero, trebuie să aibă graficul unei distribuții a probabilităților y-coordonate care nu sunt negative. O altă caracteristică a probabilităților, și anume aceea, este maximul care poate fi probabilitatea unui eveniment, apare într-un alt mod.

Zona = Probabilitatea

Graficul unei distribuții a probabilităților este construit astfel încât zonele să reprezinte probabilități. Pentru o distribuție discretă a probabilităților, tocmai calculăm doar zonele dreptunghiurilor. În graficul de mai sus, zonele celor trei bare corespunzătoare a patru, cinci și șase corespund probabilității ca suma zarurilor noastre să fie de patru, cinci sau șase. Zonele tuturor barurilor se ridică la un total.

În distribuția normală standard sau curba clopotului, avem o situație similară. Zona de sub curba dintre două z valorile corespund probabilității ca variabila noastră să se încadreze între aceste două valori. De exemplu, zona de sub curba clopotului pentru -1 z.

Distribuții importante

Există literalmente multe distribuții de probabilitate la infinit. Urmează o listă a unor distribuții mai importante:

  • Distribuție binomială - Oferă numărul de succese pentru o serie de experimente independente, cu două rezultate
  • Distribuția Chi-pătrat - Pentru a determina cât de apropiate se potrivesc un model propus
  • F-distribuție - Folosit în analiza varianței (ANOVA)
  • Distributie normala - Se numește curba clopotului și se găsește în statistici.
  • Distribuția elevului t - Pentru utilizare cu dimensiuni mici de eșantion dintr-o distribuție normală