Chi-Square Test de bunătate

Bunătatea chi-pătrat a testului de potrivire este o variație a testului chi-pătrat mai general. Setarea pentru acest test este o singură variabilă categorică care poate avea mai multe niveluri. Adesea, în această situație, vom avea în minte un model teoretic pentru o variabilă categorică. Prin acest model ne așteptăm ca anumite proporții ale populației să se încadreze în fiecare dintre aceste niveluri. O testare a bunătății de potrivire determină cât de bine se potrivește proporțiile așteptate din modelul nostru teoretic.

Ipoteze nule și alternative

Ipotezele nule și alternative pentru o bunătate a testului de potrivire arată diferit de unele dintre celelalte teste ale noastre ipoteze. Un motiv pentru acest lucru este faptul că o bunătate chi-pătrată a testului de potrivire este o metodă nonparametrică. Aceasta înseamnă că testul nostru nu se referă la un singur parametru de populație. Astfel, ipoteza nulă nu afirmă că un singur parametru preia o anumită valoare.

Începem cu o variabilă categorică cu n niveluri și lăsați peu să fie proporția populației la nivel eu. Modelul nostru teoretic are valori de qeu pentru fiecare dintre proporții. Enunțarea ipotezelor nule și alternative sunt următoarele:

  • H0: p1 = q1, p2 = q2,... pn = qn
  • HA: Pentru cel puțin unul eu, peu nu este egal cu qeu.

Numărul real și cel așteptat

Calculul unei statistici chi-pătrate implică o comparație între numărul real al variabilelor din datele din eșantionul nostru simplu aleatoriu și numărul preconizat al acestor variabile. Numărul real provine direct din eșantionul nostru. Modul în care se calculează numărul estimat depinde de testul chi-pătrat pe care îl utilizăm.

Pentru un test de bună calitate, avem un model teoretic pentru modul în care datele noastre ar trebui să fie proporționate. Simplificăm aceste proporții cu dimensiunea eșantionului n pentru a obține numărul nostru așteptat.

Calculul testelor statistice

Statistica chi-pătrat pentru testarea bunătății de testare este determinată prin compararea numărului real și așteptat pentru fiecare nivel al variabilei noastre categorice. Etapele pentru calcularea statisticii chi-pătrate pentru o bună probabilitate de testare sunt următoarele:

  1. Pentru fiecare nivel, scade numărul observat din numărul scontat.
  2. Pătrate fiecare dintre aceste diferențe.
  3. Împărțiți fiecare dintre aceste diferențe pătrate la valoarea așteptată corespunzătoare.
  4. Adăugați împreună toate numerele din pasul anterior. Aceasta este statica noastră chi-pătrată.

Dacă modelul nostru teoretic se potrivește perfect cu datele observate, atunci numărul preconizat nu va arăta nicio abatere de la numărurile observate ale variabilei noastre. Aceasta va însemna că vom avea o statistică chi-pătrată de zero. În orice altă situație, statistica chi-pătrat va fi un număr pozitiv.

Grade de libertate

Numărul de grade de libertate nu necesită calcule dificile. Tot ce trebuie să facem este să scădem unul din numărul de niveluri ale variabilei noastre categorice. Acest număr ne va informa care dintre distribuțiile infinite de chi-pătrate ar trebui să folosim.

Tabelul Chi-patrat și valoarea P

Statistica chi-pătrat pe care am calculat-o corespunde unei anumite locații pe o distribuție chi-pătrată cu numărul corespunzător de grade de libertate. Valoarea p determină probabilitatea obținerii unei statistici de testare la această extremă, presupunând că ipoteza nulă este adevărată. Putem utiliza un tabel de valori pentru o distribuție chi-pătrată pentru a determina valoarea p a testului nostru de ipoteză. Dacă avem software-ul statistic disponibil, atunci acesta poate fi utilizat pentru a obține o estimare mai bună a valorii p.

Regula deciziei

Luăm decizia noastră de a respinge ipoteza nulă pe baza unui nivel de semnificație predeterminat. Dacă valoarea noastră p este mai mică sau egală cu acest nivel de semnificație, atunci respingem ipoteza nulă. În caz contrar, nu reușim să respingem ipoteza nulă.