Plus patru intervale de încredere

În statistici inferențiale, intervalele de încredere pentru proporțiile populației se bazează pe distribuția normală normală pentru a determina parametrii necunoscuți ai unei populații date, dat cu un eșantion statistic al populației. Un motiv pentru acest lucru este acela că pentru dimensiunile de eșantion adecvate, distribuția normală normală face o treabă excelentă la estimarea unei distribuții binomiale. Acest lucru este remarcabil, deoarece deși prima distribuție este continuă, a doua este discretă.

Există o serie de probleme care trebuie abordate la construirea unor intervale de încredere pentru proporții. Unul dintre acestea se referă la ceea ce este cunoscut ca un interval de încredere „plus patru”, ceea ce duce la un estimator părtinitor. Cu toate acestea, acest estimator al unei proporții de populație necunoscută are performanțe mai bune în unele situații decât estimatorii nepărtinitori, în special acele situații în care nu există succese sau eșecuri în date.

În cele mai multe cazuri, cea mai bună încercare de a estima o proporție a populației este utilizarea unei proporții de eșantion corespunzătoare. Presupunem că există o populație cu o proporție necunoscută p dintre indivizii săi care conțin o anumită trăsătură, atunci formăm un simplu eșantion de mărime n din această populație.Din acestea n indivizi, numărăm numărul acestora Y care posedă trăsătura despre care suntem curioși. Acum estimăm p folosind proba noastră. Proporția probei Y / n este un estimator imparțial al p.

Când să utilizați intervalul Plus Four de încredere

Când folosim un interval plus patru, modificăm estimatorul de p. Facem acest lucru prin adăugarea a patru la numărul total de observații, explicând astfel expresia „plus patru.” Am împărțit apoi aceste patru observații între două succese ipotetice și două eșecuri, ceea ce înseamnă că adăugăm două la numărul total de succese. rezultatul final este că înlocuim fiecare instanță a Y / n cu (Y + 2) / (n + 4), iar uneori această fracție este notată cu p cu o tilde deasupra ei.

Proporția eșantionului funcționează de obicei foarte bine la estimarea proporției populației. Cu toate acestea, există unele situații în care trebuie să ne modificăm ușor estimatorul. Practica statistică și teoria matematică arată că modificarea intervalului plus patru este adecvată pentru îndeplinirea acestui obiectiv.

O situație care ar trebui să ne determine să luăm în considerare un interval de patru plus este un eșantion nedisponibil. De multe ori, datorită proporției populației atât de mică sau atât de mare, proporția eșantionului este, de asemenea, foarte apropiată de 0 sau foarte apropiată de 1. În acest tip de situație, ar trebui să luăm în considerare un interval de patru plus.

Un alt motiv pentru utilizarea unui interval plus patru este dacă avem o dimensiune mică a eșantionului. Un plus de patru intervale în această situație oferă o estimare mai bună pentru o proporție a populației decât utilizarea intervalului de încredere tipic pentru o proporție.

Reguli pentru utilizarea Plus Four Interval de încredere

Plus patru intervale de încredere este o modalitate aproape magică de a calcula statisticile inferențiale mai exact în faptul că adăugând pur și simplu patru observații imaginare la orice set de date dat, două reușite și două eșecuri, este capabil să prezică mai exact proporția unui set de date care se potrivește parametrilor.

Cu toate acestea, intervalul de încredere plus-patru nu este întotdeauna aplicabil la fiecare problemă. Poate fi utilizat numai atunci când intervalul de încredere al unui set de date este peste 90% și dimensiunea eșantionului populației este de cel puțin 10. Cu toate acestea, setul de date poate conține orice număr de succese și eșecuri, deși funcționează mai bine atunci când există fie nu există succese, fie nu eșecuri în datele populației date.

Rețineți că, spre deosebire de calculele statisticilor obișnuite, calculele statisticilor inferențiale se bazează pe o eșantionare de date pentru a determina cele mai probabile rezultate dintr-o populație. Deși plus patru intervale de încredere corectează o marjă de eroare mai mare, această marjă trebuie să fie luată în considerare pentru a oferi cea mai precisă observație statistică.