Practica statistică a testării ipotezelor este răspândită nu numai în statistici, ci și în întreaga științe naturale și sociale. Când efectuăm un test de ipoteză, există câteva lucruri care ar putea merge prost. Există două tipuri de erori, care prin proiectare nu pot fi evitate și trebuie să fim conștienți că aceste erori există. Erorilor li se dau nume destul de pietonale ale erorilor de tip I și de tip II. Care sunt erorile de tip I și cele de tip II și cum distingem între ele? Scurt:
Vom explora mai multe fundaluri în spatele acestor tipuri de erori cu scopul de a înțelege aceste afirmații.
Procesul de testare a ipotezelor poate părea destul de variat cu o multitudine de statistici de testare. Dar procesul general este același. Testarea ipotezei implică enunțarea unei ipoteze nule și selectarea unui nivel de semnificație. Ipoteza nulă este adevărată sau falsă și reprezintă revendicarea implicită pentru un tratament sau o procedură. De exemplu, atunci când examinăm eficacitatea unui medicament, ipoteza nulă ar fi că medicamentul nu are efect asupra unei boli.
După formularea ipotezei nule și alegerea unui nivel de semnificație, obținem date prin observație. Calculele statistice ne spun dacă ar trebui sau nu să respingem ipoteza nulă.
Într-o lume ideală, am respinge întotdeauna ipoteza nulă atunci când este falsă și nu am respinge ipoteza nulă atunci când este într-adevăr adevărată. Există însă alte două scenarii care sunt posibile, fiecare dintre acestea având ca rezultat o eroare.
Primul tip de eroare care este posibil implică respingerea unei ipoteze nule, care este de fapt adevărată. Acest tip de eroare se numește eroare de tip I și uneori se numește eroare de primul tip.
Erorile de tip I sunt echivalente cu falsele pozitive. Să revenim la exemplul unui medicament utilizat pentru a trata o boală. Dacă respingem ipoteza nulă în această situație, atunci afirmația noastră este că, de fapt, medicamentul are vreun efect asupra unei boli. Dar dacă ipoteza nulă este adevărată, atunci, în realitate, medicamentul nu combate deloc boala. Se afirmă fals că medicamentul are un efect pozitiv asupra unei boli.
Erorile de tip I pot fi controlate. Valoarea alfa, care este legată de nivelul de semnificație pe care l-am ales, are o influență directă asupra erorilor de tip I. Alpha este probabilitatea maximă de a avea o eroare de tip I. Pentru un nivel de încredere de 95%, valoarea alfa este de 0,05. Aceasta înseamnă că există o probabilitate de 5% ca vom respinge o adevărată ipoteză nulă. Pe termen lung, unul din fiecare douăzeci de teste de ipoteză pe care le efectuăm la acest nivel va avea ca rezultat o eroare de tip I.
Celălalt tip de eroare care este posibil apare atunci când nu respingem o ipoteză nulă care este falsă. Acest tip de eroare se numește eroare de tip II și este de asemenea denumită eroare de al doilea tip.
Erorile de tip II sunt echivalente cu falsele negative. Dacă ne gândim din nou la scenariul în care testăm un medicament, cum ar arăta o eroare de tip II? O eroare de tip II ar apărea dacă am accepta că medicamentul nu are efect asupra unei boli, dar, în realitate, s-a întâmplat.
Probabilitatea unei erori de tip II este dată de litera greacă beta. Acest număr este legat de puterea sau sensibilitatea testului de ipoteză, notat cu 1 - beta.
Erorile de tip I și de tip II fac parte din procesul de testare a ipotezelor. Deși erorile nu pot fi eliminate complet, putem minimiza un tip de eroare.
De obicei, atunci când încercăm să reducem probabilitatea unui tip de eroare, probabilitatea pentru celălalt tip crește. Am putea scădea valoarea alfa de la 0,05 la 0,01, ceea ce corespunde unui nivel de încredere de 99%. Cu toate acestea, dacă toate celelalte rămân la fel, atunci probabilitatea unei erori de tip II va crește aproape întotdeauna.
De multe ori, aplicarea lumii reale a testului nostru de ipoteză va determina dacă acceptăm mai mult erorile de tip I sau de tip II. Aceasta va fi folosită atunci când proiectăm experimentul nostru statistic.