Statisticile inferențiale își primesc numele din ceea ce se întâmplă în această ramură a statisticilor. În loc să descrie pur și simplu un set de date, statisticile inferențiale încearcă să deducă ceva despre o populație pe baza unui eșantion statistic. Un obiectiv specific în statisticile inferențiale implică determinarea valorii unui parametru de populație necunoscut. Gama de valori pe care o folosim pentru a estima acest parametru se numește interval de încredere.
Un interval de încredere este format din două părți. Prima parte este estimarea parametrului populației. Obținem această estimare folosind un eșantion simplu aleatoriu. Din acest eșantion, calculăm statistica care corespunde parametrului pe care dorim să îl estimăm. De exemplu, dacă ne-ar interesa interesul înălțimii medii a tuturor studenților din clasa I din Statele Unite, am folosi un eșantion simplu la întâmplare de gradatori din SUA, să-i măsurăm pe toți și apoi să calculăm înălțimea medie a eșantionului nostru.
A doua parte a unui interval de încredere este marja de eroare. Acest lucru este necesar, deoarece estimarea noastră poate fi diferită de valoarea reală a parametrului populației. Pentru a permite alte valori potențiale ale parametrului, trebuie să producem o serie de numere. Marja de eroare face acest lucru și fiecare interval de încredere are următoarea formă:
Estimarea ± Marja de eroare
Estimarea se află în centrul intervalului, iar apoi scădem și adăugăm marja de eroare din această estimare pentru a obține o gamă de valori pentru parametrul.
Atasat fiecarui interval de incredere este un nivel de incredere. Aceasta este o probabilitate sau procente care indică câtă certitudine ar trebui să ni se atribuie intervalului nostru de încredere. Dacă toate celelalte aspecte ale unei situații sunt identice, cu atât nivelul de încredere este mai mare, cu atât intervalul de încredere este mai larg.
Acest nivel de încredere poate duce la o oarecare confuzie. Nu este o declarație despre procedura de eșantionare sau despre populație. În schimb, oferă o indicație a succesului procesului de construcție a unui interval de încredere. De exemplu, intervalele de încredere cu o încredere de 80 la sută vor rata, pe termen lung, adevăratul parametru al populației unul din cinci ori.
Orice număr de la zero la unu ar putea fi, teoretic, utilizat pentru un nivel de încredere. În practică, 90%, 95% și 99% sunt toate nivelurile comune de încredere.
Marja de eroare a unui nivel de încredere este determinată de o serie de factori. Putem vedea acest lucru examinând formula pentru marja de eroare. O marjă de eroare are forma:
Marja de eroare = (Statistică pentru nivelul de încredere) * (Abatere standard / eroare)
Statistica nivelului de încredere depinde de ce distribuție de probabilitate este utilizată și de ce nivel de încredere am ales. De exemplu, dacă Ceste nivelul nostru de încredere și atunci lucrăm cu o distribuție normală C este zona sub curba dintre -z* la z*. Acest număr z* este numărul din formula noastră de eroare.
Celălalt termen necesar în marja noastră de eroare este abaterea standard sau eroarea standard. Este preferată aici abaterea standard a distribuției cu care lucrăm. Cu toate acestea, de obicei parametrii din populație nu sunt cunoscuți. Acest număr nu este de obicei disponibil atunci când se formează intervale de încredere în practică.
Pentru a face față acestei incertitudini în cunoașterea abaterii standard, folosim în schimb eroarea standard. Eroarea standard care corespunde unei abateri standard este o estimare a acestei abateri standard. Ceea ce face eroarea standard atât de puternică este că este calculat din eșantionul simplu aleatoriu care este utilizat pentru a calcula estimarea noastră. Nu este necesară nicio informație suplimentară, deoarece eșantionul face toate estimările pentru noi.
Există o varietate de situații diferite care necesită intervale de încredere. Aceste intervale de încredere sunt utilizate pentru a estima o serie de parametri diferiți. Deși aceste aspecte sunt diferite, toate aceste intervale de încredere sunt unite de același format general. Unele intervale comune de încredere sunt cele pentru media populației, variația populației, proporția populației, diferența a două mijloace de populație și diferența a două proporții de populație.