Intervalele de încredere sunt o parte cheie a statisticilor inferențiale. Putem utiliza unele probabilități și informații dintr-o distribuție de probabilitate pentru a estima un parametru de populație cu utilizarea unui eșantion. Declarația unui interval de încredere se face în așa fel încât să fie ușor înțeleasă greșit. Vom analiza interpretarea corectă a intervalelor de încredere și vom cerceta patru greșeli care sunt făcute cu privire la acest domeniu de statistică.
Un interval de încredere poate fi exprimat fie ca o gamă de valori, fie în următoarea formă:
Estimarea ± Marja de eroare
Un interval de încredere este de obicei declarat cu un nivel de încredere. Nivelurile comune de încredere sunt 90%, 95% și 99%.
Vom analiza un exemplu în care dorim să folosim un eșantion mediu pentru a deduce media unei populații. Să presupunem că aceasta are ca rezultat un interval de încredere între 25 și 30. Dacă spunem că suntem 95% siguri că media populației necunoscute este conținută în acest interval, atunci spunem cu adevărat că am găsit intervalul folosind o metodă care are succes în oferind rezultate corecte 95% din timp. Pe termen lung, metoda noastră nu va reuși 5% din timp. Cu alte cuvinte, nu vom reuși să surprindem adevărata populație înseamnă doar una din 20 de ori.
Vom analiza acum o serie de greșeli diferite care pot fi făcute atunci când abordăm intervale de încredere. O declarație incorectă care se face adesea despre un interval de încredere la un nivel de încredere de 95% este că există o șansă de 95% ca intervalul de încredere să conțină media reală a populației.
Motivul pentru care aceasta este o greșeală este de fapt destul de subtil. Ideea cheie referitoare la un interval de încredere este aceea că probabilitatea utilizată intră în imagine cu metoda folosită, pentru a determina intervalul de încredere este că se referă la metoda folosită.
O a doua greșeală este interpretarea unui interval de încredere de 95%, spunând că 95% din toate valorile datelor din populație se încadrează în acest interval. Din nou, 95% vorbește despre metoda testului.
Pentru a vedea de ce afirmația de mai sus este incorectă, am putea lua în considerare o populație normală cu o abatere standard de 1 și o medie de 5. Un eșantion care a avut două puncte de date, fiecare cu valori de 6 are o probă medie de 6. Un 95% Intervalul de încredere pentru media populației ar fi de 4,6 până la 7,4. Acest lucru nu se suprapune în mod clar cu 95% din distribuția normală, deci nu va conține 95% din populație.
O a treia greșeală este să spunem că un interval de încredere de 95% implică faptul că 95% din toate mijloacele de probă posibile se încadrează în intervalul. Reconsiderați exemplul din ultima secțiune. Orice eșantion de dimensiunea a doua care a fost alcătuit doar din valori mai mici de 4.6 ar avea o medie care a fost mai mică de 4.6. Astfel, aceste mijloace de eșantion ar fi în afara acestui interval de încredere particular. Probele care se potrivesc cu această descriere reprezintă mai mult de 5% din suma totală. Deci este o greșeală să spunem că acest interval de încredere captează 95% din toate mijloacele de probă.
O a patra greșeală în tratarea intervalelor de încredere este de a crede că acestea sunt singura sursă de eroare. Deși există o marjă de eroare asociată cu un interval de încredere, există și alte locuri în care erorile se pot strecura într-o analiză statistică. Câteva exemple de aceste tipuri de erori ar putea fi dintr-o proiectare incorectă a experimentului, prejudecată în eșantionare sau incapacitatea de a obține date dintr-un anumit subset de populație.