Exemplu de două probe de probă T și interval de încredere

Uneori, în statistici, este util să vezi exemple elaborate de probleme. Aceste exemple ne pot ajuta să găsim probleme similare. În acest articol, vom parcurge procesul de realizare a statisticilor inferențiale pentru un rezultat privind două mijloace de populație. Nu numai că vom vedea cum să efectuăm un test de ipoteză despre diferența a două mijloace de populație, vom construi și un interval de încredere pentru această diferență. Metodele pe care le folosim sunt uneori numite test de două probe t și interval de încredere de două probe t.

Declarația problemei

Să presupunem că dorim să testăm aptitudinea matematică a copiilor de școală. O întrebare pe care o putem avea este dacă nivelurile de grad mai ridicat au scoruri medii mai mari.

Un eșantion simplu aleatoriu de 27 de gradatori a treia este dat un test de matematică, răspunsurile lor sunt notate, iar rezultatele au un scor mediu de 75 de puncte cu o probă abatere standard de 3 puncte.

Un eșantion simplu aleatoriu de 20 de clase a cincea este dat același test de matematică și răspunsurile lor sunt notate. Scorul mediu pentru elevii de cincilea este de 84 de puncte, cu o probă de abatere standard de 5 puncte.

Având în vedere acest scenariu, ne punem următoarele întrebări:

  • Datele din eșantion ne oferă dovezi că scorul mediu de testare a populației tuturor celor cinci clase este mai mare decât scorul mediu de testare a populației tuturor celor trei gradatori?
  • Care este un interval de încredere de 95% pentru diferența scorurilor medii ale testelor între populațiile de gradatori a treia și cele de gradul cinci?

Condiții și procedură

Trebuie să selectăm ce procedură să folosim. Pentru a face acest lucru, trebuie să ne asigurăm că și să verificăm dacă au fost îndeplinite condițiile pentru această procedură. Ni se cere să comparăm două mijloace de populație. O colecție de metode care pot fi utilizate pentru a face acest lucru sunt cele pentru proceduri t cu două probe.

Pentru a utiliza aceste proceduri t pentru două probe, trebuie să ne asigurăm că următoarele condiții păstrează:

  • Avem două probe simple aleatoare din cele două populații de interes.
  • Probele noastre aleatorii simple nu constituie mai mult de 5% din populație.
  • Cele două probe sunt independente unele de altele și nu există nicio potrivire între subiecți.
  • Variabila este distribuită în mod normal.
  • Atât media populației, cât și abaterea standard sunt necunoscute pentru ambele populații.

Vedem că majoritatea acestor condiții sunt îndeplinite. Ni s-a spus că avem probe simple aleatorii. Populațiile pe care le studiem sunt mari, deoarece există milioane de studenți în aceste niveluri de clasă.

Condiția pe care nu putem să o asumăm automat este dacă scorurile testului sunt distribuite în mod normal. Deoarece avem o dimensiune suficientă de eșantion suficient de mare, prin robustetea procedurilor noastre t, nu este neapărat nevoie ca variabila să fie distribuită în mod normal.

Deoarece condițiile sunt îndeplinite, efectuăm câteva calcule preliminare.

Eroare standard

Eroarea standard este o estimare a unei abateri standard. Pentru această statistică, adăugăm variația de probă a probelor și apoi luăm rădăcina pătrată. Aceasta oferă formula:

(s1 2 / n1 + s22 / n2)1/2

Folosind valorile de mai sus, vedem că valoarea erorii standard este