O histogramă este un tip de grafic care are aplicații largi în statistici. Histogramele oferă o interpretare vizuală a datelor numerice, indicând numărul de puncte de date care se află într-o gamă de valori. Aceste intervale de valori se numesc clase sau pubele. Frecvența datelor care se încadrează în fiecare clasă este descrisă prin utilizarea unei bare. Cu cât este mai mare bara, cu atât este mai mare frecvența valorilor datelor din coșul respectiv.
La prima vedere, histogramele arată foarte asemănător cu graficele cu bare. Ambele grafice folosesc bare verticale pentru a reprezenta datele. Înălțimea unei bare corespunde frecvenței relative a cantității de date din clasă. Cu cât este mai mare bara, cu atât este mai mare frecvența datelor. Cu cât este mai mică bara, cu atât este mai mică frecvența datelor. Dar privirile pot fi înșelătoare. Aici se termină asemănările între cele două tipuri de grafice.
Motivul pentru care aceste tipuri de grafice sunt diferite are legătură cu nivelul de măsurare a datelor. Pe de o parte, grafice cu bare sunt utilizate pentru date la nivelul nominal de măsurare. Graficele cu bare măsoară frecvența datelor categorice, iar clasele pentru un grafic cu bare sunt aceste categorii. Pe de altă parte, histogramele sunt utilizate pentru date care sunt cel puțin la nivelul ordinal de măsurare. Clasele pentru o histogramă sunt intervale de valori.
O altă diferență cheie între graficele cu bare și histograme are legătură cu ordonarea barelor. Într-un grafic cu bare, este o practică obișnuită să rearanjați barele în ordinea scăderii înălțimii. Cu toate acestea, barele dintr-o histogramă nu pot fi rearanjate. Acestea trebuie afișate în ordinea în care au loc cursurile.
Diagrama de mai sus ne arată o histogramă. Să presupunem că patru monede sunt răsucite și rezultatele sunt înregistrate. Utilizarea tabelului de distribuție binomial corespunzător sau calcule simple cu formula binomală arată probabilitatea ca niciun cap să nu fie afișat este 1/16, probabilitatea ca un cap să fie afișat este de 4/16. Probabilitatea a două capete este 6/16. Probabilitatea a trei capete este de 4/16. Probabilitatea a patru capete este 1/16.
Construim un total de cinci clase, fiecare cu lățimea una. Aceste clase corespund numărului de capete posibile: zero, unu, doi, trei sau patru. Deasupra fiecărei clase, desenăm o bară sau un dreptunghi vertical. Înălțimile acestor bare corespund probabilităților menționate pentru experimentul nostru de probabilitate de a flipping patru monede și numărarea capetelor.
Exemplul de mai sus nu numai că demonstrează construcția unei histograme, dar arată, de asemenea, că distribuțiile de probabilitate discrete pot fi reprezentate cu o histogramă. Într-adevăr, și distribuția discretă a probabilității poate fi reprezentată de o histogramă.
Pentru a construi o histogramă care reprezintă o distribuție a probabilităților, începem prin selectarea claselor. Acestea ar trebui să fie rezultatele unui experiment de probabilitate. Lățimea fiecăreia dintre aceste clase trebuie să fie o unitate. Înălțimile barelor histogramei sunt probabilitățile pentru fiecare dintre rezultatele obținute. Cu o histogramă construită în așa fel, zonele barelor sunt, de asemenea, probabilități.
Din moment ce acest tip de histogramă ne oferă probabilități, este supus unui cuplu de condiții. O singură prevedere este aceea că doar numerele non-negative pot fi utilizate pentru scala care ne oferă înălțimea unei baruri date a histogramei. O a doua condiție este aceea, deoarece probabilitatea este egală cu suprafața, toate zonele barelor trebuie să se ridice la un total, echivalentul a 100%.
Barele dintr-o histogramă nu trebuie să fie probabilități. Histogramele sunt utile în alte domenii decât probabilitatea. Oricând dorim să comparăm frecvența apariției datelor cantitative, o histogramă poate fi utilizată pentru a descrie setul nostru de date.