Erori de tip I și de tip II în statistici

Erorile de tip I din statistici apar atunci când statisticienii resping în mod incorect ipoteza nulă sau declarația fără efect, când ipoteza nulă este adevărată, în timp ce erorile de tip II apar atunci când statisticienii nu reușesc să respingă ipoteza nulă și ipoteza alternativă sau declarația pentru care testul este efectuat pentru a oferi dovezi în sprijinul, este adevărat.

Erorile de tip I și cele de tip II sunt ambele încorporate în procesul de testare a ipotezelor și, deși poate părea că am dori să facem probabilitatea ambelor erori să fie cât mai mică, de multe ori nu este posibil să reducem probabilitățile erori, care pune întrebarea: „Care dintre cele două erori este mai gravă?

Răspunsul scurt la această întrebare este că depinde cu adevărat de situație. În unele cazuri, o eroare de tip I este de preferat unei erori de tip II, dar în alte aplicații, o eroare de tip I este mai periculoasă decât o eroare de tip II. Pentru a asigura o planificare adecvată a procedurii de testare statistică, trebuie să luați în considerare cu atenție consecințele ambelor tipuri de erori atunci când vine momentul să decidă dacă respinge sau nu ipoteza nulă. Vom vedea exemple de ambele situații în ceea ce urmează.

Erori de tip I și de tip II

Începem prin amintirea definiției unei erori de tip I și a unei erori de tip II. În majoritatea testelor statistice, ipoteza nulă este o afirmație a revendicării prevalente despre o populație fără efect particular, în timp ce ipoteza alternativă este afirmația pe care dorim să o oferim dovezi în testul nostru de ipoteză. Pentru testele de semnificație există patru rezultate posibile:

  1. Respingem ipoteza nulă și ipoteza nulă este adevărată. Aceasta este ceea ce este cunoscută ca eroare de tip I.
  2. Respingem ipoteza nulă, iar ipoteza alternativă este adevărată. În această situație, decizia corectă a fost luată.
  3. Nu reușim să respingem ipoteza nulă și ipoteza nulă este adevărată. În această situație, decizia corectă a fost luată.
  4. Nu reușim să respingem ipoteza nulă, iar ipoteza alternativă este adevărată. Aceasta este ceea ce este cunoscută sub numele de eroare de tip II.

Evident, rezultatul preferat al oricărui test de ipoteză statistică ar fi al doilea sau al treilea, în care decizia corectă a fost luată și nu a apărut nicio eroare, dar, de cele mai multe ori, se face o eroare în cursul testării ipotezei - dar asta este totul o parte a procedurii. Totuși, să știi să conduci corect o procedură și să eviti „falsele pozitive” poate contribui la reducerea numărului de erori de tip I și de tip II.

Diferențele de bază ale erorilor de tip I și de tip II

În termeni mai mult colocviali, putem descrie aceste două tipuri de erori ca fiind corespunzătoare anumitor rezultate ale unei proceduri de testare. Pentru o eroare de tip I respingem în mod incorect ipoteza nulă, cu alte cuvinte, testul nostru statistic oferă în mod fals dovezi pozitive pentru ipoteza alternativă. Astfel, o eroare de tip I corespunde unui rezultat al testului „fals pozitiv”.

Pe de altă parte, o eroare de tip II apare atunci când ipoteza alternativă este adevărată și nu respingem ipoteza nulă. În acest fel, testul nostru furnizează în mod incorect dovezi împotriva ipotezei alternative. Astfel, o eroare de tip II poate fi considerată ca un rezultat al testului „fals negativ”.

În esență, aceste două erori sunt inversuri una de cealaltă, motiv pentru care acoperă întreaga eroare făcută la testarea statistică, dar diferă, de asemenea, impactul lor dacă eroarea de tip I sau de tip II rămâne nedescoperită sau nerezolvată..

Care eroare este mai bună

Gândind în termeni de rezultate fals pozitive și false, suntem mai bine dotați să luăm în considerare care dintre aceste erori sunt mai bune - tipul II pare să aibă o conotație negativă, din motive întemeiate.

Să presupunem că proiectați un screening medical pentru o boală. O falsă pozitivă a unei erori de tip I poate provoca o anumită anxietate pacientului, dar acest lucru va duce la alte proceduri de testare care vor dezvălui că testul inițial a fost incorect. Dimpotrivă, un fals negativ din eroarea de tip II ar oferi pacientului asigurarea incorectă că nu are o boală atunci când de fapt. Ca urmare a acestor informații incorecte, boala nu va fi tratată. Dacă medicii ar putea alege între aceste două opțiuni, un fals pozitiv este mai de dorit decât un fals fals.

Să presupunem acum că cineva a fost judecat pentru omor. Ipoteza nulă este aceea că persoana nu este vinovată. O eroare de tip I ar apărea dacă persoana a fost găsită vinovată de o crimă pe care nu a comis-o, ceea ce ar fi un rezultat foarte grav pentru inculpat. Pe de altă parte, o eroare de tip II s-ar produce dacă juriul găsește persoana care nu este vinovată, chiar dacă a comis crima, ceea ce reprezintă un rezultat excelent pentru inculpat, dar nu pentru societatea în ansamblu. Aici vedem valoarea într-un sistem judiciar care încearcă să reducă la minimum erorile de tip I.