Una dintre principalele părți ale statisticilor inferențiale este dezvoltarea unor modalități de calculare a intervalelor de încredere. Intervalele de încredere ne oferă o modalitate de estimare a unui parametru de populație. În loc să spunem că parametrul este egal cu o valoare exactă, spunem că parametrul se încadrează într-o gamă de valori. Acest interval de valori este, de obicei, o estimare, împreună cu o marjă de eroare pe care o adăugăm și scădem din estimare.
Atasat fiecarui interval este un nivel de incredere. Nivelul de încredere oferă o măsurare a cât de des, pe termen lung, metoda folosită pentru obținerea intervalului nostru de încredere surprinde adevăratul parametru al populației.
Este util când aflați despre statistici pentru a vedea câteva exemple elaborate. Mai jos vom analiza câteva exemple de intervale de încredere despre media populației. Vom vedea că metoda pe care o folosim pentru a construi un interval de încredere despre o medie depinde de informații suplimentare despre populația noastră. Mai exact, abordarea pe care o adoptăm depinde de faptul dacă cunoaștem sau nu abaterea standard a populației.
Declarația problemelor
Începem cu un simplu eșantion aleatoriu de 25 de specii de pălării și le măsurăm cozile. Lungimea medie a cozii eșantionului nostru este de 5 cm.
Dacă știm că 0,2 cm este abaterea standard a lungimilor cozii tuturor salopetelor din populație, atunci ceea ce este un interval de încredere de 90% pentru lungimea medie a cozii tuturor salopetelor din populație?
Dacă știm că 0,2 cm este abaterea standard a lungimilor cozii tuturor salopetelor din populație, atunci ceea ce este un interval de încredere de 95% pentru lungimea medie a cozii tuturor salopetelor din populație?
Dacă constatăm că acel 0,2 cm este abaterea standard a lungimilor cozii din capriori în eșantionul nostru de populație, atunci ceea ce este un interval de încredere de 90% pentru lungimea medie a cozii tuturor salopilor din populație?
Dacă constatăm că acel 0,2 cm este abaterea standard a lungimilor cozii din capriori în eșantionul nostru de populație, atunci ceea ce este un interval de încredere de 95% pentru lungimea medie a cozii tuturor salopilor din populație?
Discutarea problemelor
Începem prin analizarea fiecăreia dintre aceste probleme. În primele două probleme cunoaștem valoarea abaterii standard a populației. Diferența dintre aceste două probleme este că nivelul de încredere este mai mare în numărul 2 decât ceea ce este pentru numărul 1.
În a doua problemă nu se cunoaște abaterea standard a populației. Pentru aceste două probleme, vom estima acest parametru cu abaterea standard a eșantionului. După cum am văzut în primele două probleme, aici avem și niveluri de încredere diferite.
soluţii
Vom calcula soluții pentru fiecare dintre problemele de mai sus.
Deoarece cunoaștem abaterea standard a populației, vom folosi un tabel cu scoruri z. Valoarea a z care corespunde unui interval de încredere de 90% este 1.645. Folosind formula pentru marja de eroare avem un interval de încredere între 5 - 1.645 (0.2 / 5) până la 5 + 1.645 (0.2 / 5). (Cele 5 din numitor aici se datorează faptului că am luat rădăcina pătrată de 25). După efectuarea aritmeticii, avem 4.934 cm până la 5.066 cm ca interval de încredere pentru media populației.
Deoarece cunoaștem abaterea standard a populației, vom folosi un tabel cu scoruri z. Valoarea a z care corespunde unui interval de încredere de 95% este 1,96. Folosind formula pentru marja de eroare avem un interval de încredere între 5 - 1.96 (0.2 / 5) până la 5 + 1.96 (0.2 / 5). După efectuarea aritmeticii, avem 4.922 cm până la 5.078 cm ca interval de încredere pentru media populației.
Aici nu cunoaștem abaterea standard a populației, doar abaterea standard a eșantionului. Astfel vom folosi un tabel cu scoruri. Când folosim un tabel din T scoruri trebuie să știm câte grade de libertate avem. În acest caz, există 24 de grade de libertate, care este mai mică decât dimensiunea eșantionului de 25 T care corespunde unui interval de încredere de 90% este 1,71. Folosind formula pentru marja de eroare avem un interval de încredere între 5 - 1,71 (0,2 / 5) până la 5 + 1,71 (0,2 / 5). După efectuarea aritmeticii, avem 4.932 cm până la 5.068 cm ca interval de încredere pentru media populației.
Aici nu cunoaștem abaterea standard a populației, doar abaterea standard a eșantionului. Astfel vom folosi din nou un tabel cu scoruri. Există 24 de grade de libertate, care este mai mică decât dimensiunea eșantionului de 25 T care corespunde unui interval de încredere de 95% este 2,06. Folosind formula pentru marja de eroare, avem un interval de încredere între 5 - 2.06 (0.2 / 5) până la 5 + 2.06 (0.2 / 5). După efectuarea aritmeticii, avem 4.912 cm până la 5.082 cm ca interval de încredere pentru media populației.
Discuția soluțiilor
Există câteva lucruri de remarcat în compararea acestor soluții. Primul este că, cu cât nivelul nostru de încredere a crescut, cu atât este mai mare valoarea z sau T cu care am terminat. Motivul pentru aceasta este că pentru a fi mai siguri că am capturat într-adevăr populația în intervalul nostru de încredere, avem nevoie de un interval mai larg.
Cealaltă caracteristică de remarcat este aceea că pentru un anumit interval de încredere, cele care le folosesc T sunt mai largi decât cei cu z. Motivul pentru aceasta este că a T distribuția are o variabilitate mai mare în cozile sale decât o distribuție normală standard.
Cheia pentru soluționarea corectă a acestor tipuri de probleme este că, dacă cunoaștem abaterea standard a populației, folosim un tabel z-înscris. Dacă nu cunoaștem abaterea standard a populației, atunci folosim un tabel din T scoruri.