Bunătatea chi-pătrat a testului de potrivire este utilă pentru a compara un model teoretic cu datele observate. Acest test este un tip al testului chi-pătrat mai general. Ca în orice subiect din matematică sau statistică, poate fi util să lucrați printr-un exemplu pentru a înțelege ce se întâmplă, printr-un exemplu de bunătate chi-pătrat de testare potrivită.
Luați în considerare un pachet standard de ciocolată cu lapte M&M. Există șase culori diferite: roșu, portocaliu, galben, verde, albastru și maro. Să presupunem că suntem curioși cu privire la distribuția acestor culori și să ne întrebăm, toate cele șase culori apar în proporție egală? Acesta este tipul de întrebare la care se poate răspunde cu un test de bunătate.
Începem prin a observa setarea și de ce este adecvată testarea bunătății. Variabila noastră de culoare este categorică. Există șase niveluri ale acestei variabile, care corespund celor șase culori care sunt posibile. Vom presupune că M&S pe care le socotim va fi un eșantion simplu aleatoriu din populația tuturor M&M.
Ipotezele nule și alternative pentru bunătatea noastră de testare potrivită reflectă ipoteza pe care o facem despre populație. Deoarece testăm dacă culorile au proporții egale, ipoteza noastră nulă va fi aceea că toate culorile apar în aceeași proporție. Mai formal, dacă p1 este proporția populației de bomboane roșii, p2 este proporția populației de bomboane portocalii și așa mai departe, atunci ipoteza nulă este că p1 = p2 = ... = p6 = 1/6.
Ipoteza alternativă este aceea că cel puțin una dintre proporțiile populației nu este egală cu 1/6.
Numărul real este numărul de bomboane pentru fiecare din cele șase culori. Numărul așteptat se referă la ceea ce ne-am aștepta dacă ipoteza nulă ar fi adevărată. Vom lăsa n să fie dimensiunea eșantionului nostru. Numărul așteptat de bomboane roșii este p1 n sau n/ 6. De fapt, de exemplu, numărul preconizat de bomboane pentru fiecare din cele șase culori este pur și simplu n ori peu, sau n/ 6.
Acum vom calcula o statistică chi-pătrată pentru un exemplu specific. Să presupunem că avem un eșantion simplu aleatoriu de 600 de bomboane M&M cu următoarea distribuție:
Dacă ipoteza nulă ar fi adevărată, atunci numărul estimat pentru fiecare din aceste culori ar fi (1/6) x 600 = 100. Acum folosim acest lucru în calculul statisticii chi-pătrate.
Calculăm contribuția la statisticile noastre din fiecare culoare. Fiecare are forma (Actual - Așteptat)2/Așteptat.:
Totalizăm apoi toate aceste contribuții și determinăm că statistica noastră de chi-pătrat este 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.
Numărul de grade de libertate pentru un test de bună calitate este pur și simplu unul mai mic decât numărul de niveluri ale variabilei noastre. De vreme ce erau șase culori, avem 6 - 1 = 5 grade de libertate.
Statistica chi-pătratului de 235,42 pe care am calculat-o corespunde unei anumite locații pe o distribuție chi-pătrată cu cinci grade de libertate. Acum avem nevoie de o valoare p, pentru a determina probabilitatea obținerii unei statistici de testare cel puțin la fel de extreme ca 235.42, în timp ce presupunem că ipoteza nulă este adevărată.
Excel pentru Microsoft poate fi utilizat pentru acest calcul. Constatăm că statisticile noastre de testare cu cinci grade de libertate au o valoare p de 7,29 x 10-49. Aceasta este o valoare p extrem de mică.
Luăm decizia noastră de a respinge ipoteza nulă pe baza mărimii valorii p. Deoarece avem o valoare p foarte minusculă, respingem ipoteza nulă. Concluzionăm că M&S nu sunt distribuite uniform între cele șase culori diferite. O analiză de urmărire ar putea fi utilizată pentru a determina un interval de încredere pentru proporția populației de o anumită culoare.