Variația populației oferă o indicație despre modul de răspândire a unui set de date. Din păcate, este de obicei imposibil de știut exact care este acest parametru al populației. Pentru a compensa lipsa de cunoștințe, folosim un subiect din statistici inferențiale numite intervale de încredere. Vom vedea un exemplu despre cum se calculează un interval de încredere pentru o variație a populației.
Formula pentru intervalul de încredere (1 - α) cu privire la variația populației. Este dat de următorul șir de inegalități:
[(n - 1)s2] / / B < σ2 < [ (n - 1)s2] / / A.
Aici n este dimensiunea eșantionului, s2 este variația probei. Numarul A este punctul distribuției chi-pătrat cu n -1 grade de libertate la care α / 2 din zona de sub curbă se află la stânga A. Într-un mod similar, numărul B este punctul aceleiași distribuții chi-pătrate cu exact α / 2 din zona de sub curba din dreapta B.
Începem cu un set de date cu 10 valori. Acest set de valori de date a fost obținut printr-un simplu eșantion aleatoriu:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Unele analize de date exploratorii ar fi necesare pentru a arăta că nu există valori exterioare. Construind o tulpină și o diagramă a frunzelor, vedem că aceste date provin dintr-o distribuție care este aproximativ normal distribuită. Aceasta înseamnă că putem continua cu găsirea unui interval de încredere de 95% pentru variația populației.
Trebuie să estimăm variația populației cu variația probei, notată cu s2. Deci, începem prin calcularea acestei statistici. În esență, facem o medie a abaterilor pătrate de la medie. Totuși, mai degrabă decât împărțirea acestei sume pe n o împărțim după n - 1.
Constatăm că media probei este 104,2. Folosind aceasta, avem suma abaterilor pătrate de la media dată de:
(97 - 104.2)2 + (75 - 104.3)2 +... + (96 - 104,2)2 + (102 - 104.2)2 = 2495,6
Împărțim această sumă cu 10 - 1 = 9 pentru a obține o variație a mostrei de 277.
Acum apelăm la distribuția noastră de chi-pătrat. Deoarece avem 10 valori de date, avem 9 grade de libertate. Deoarece ne dorim mijlocul de 95% din distribuția noastră, avem nevoie de 2,5% în fiecare din cele două cozi. Consultăm un tabel sau un software chi-pătrat și vedem că valorile tabelului de 2.7004 și 19.023 cuprind 95% din suprafața distribuției. Aceste numere sunt A și B, respectiv.
Avem acum tot ce avem nevoie și suntem pregătiți să ne asamblăm intervalul de încredere. Formula pentru punctul final stânga este [(n - 1)s2] / / B. Aceasta înseamnă că obiectivul nostru stâng este:
(9 x 277) / 19.023 = 133
Obiectivul corect este găsit înlocuind B cu A:
(9 x 277) /2.7004 = 923
Deci, suntem 95% încrezători că variația populației se situează între 133 și 923.
Desigur, având în vedere că abaterea standard este rădăcina pătrată a variației, această metodă ar putea fi utilizată pentru a construi un interval de încredere pentru abaterea standard a populației. Tot ce trebuie să facem este să luăm rădăcini pătrate ale obiectivelor. Rezultatul ar fi un interval de încredere de 95% pentru abaterea standard.