Exemplu de calcul ANOVA

O analiză a factorului de varianță, cunoscută și sub denumirea de ANOVA, ne oferă o modalitate de a face comparații multiple a mai multor mijloace de populație. În loc să facem acest lucru într-o manieră pereche, putem analiza simultan toate mijloacele luate în considerare. Pentru a efectua un test ANOVA, trebuie să comparăm două tipuri de variații, variația dintre mijloacele de probă, precum și variația din fiecare dintre probele noastre.

Combinăm toată această variantă într-o singură statistică, numită " F statistică deoarece folosește distribuția F. Facem acest lucru prin împărțirea variației între eșantioane și variația din fiecare eșantion. Modul de a face acest lucru este de obicei gestionat de software, cu toate acestea, există o anumită valoare în a vedea un astfel de calcul elaborat.

Va fi ușor să vă pierdeți în ceea ce urmează. Iată lista pașilor pe care îi vom urma în exemplul de mai jos:

  1. Calculați mijloacele de probă pentru fiecare dintre eșantioanele noastre, precum și media tuturor datelor din eșantion.
  2. Calculați suma pătratelor de eroare. Aici în cadrul fiecărui eșantion, pătrundem abaterea fiecărei date de la valoarea eșantionului. Suma tuturor abaterilor pătrate este suma pătratelor de eroare, prescurtată SSE.
  3. Calculați suma pătratelor de tratament. Am patrat abaterea fiecărei probe medii de la media generală. Suma tuturor acestor abateri pătrate se înmulțește cu una mai puțin decât numărul de probe pe care le avem. Acest număr este suma pătratelor de tratament, prescurtată SST.
  4. Calculați gradele de libertate. Numărul total de grade de libertate este unul mai mic decât numărul total de puncte de date din eșantionul nostru sau n - (1) Numărul de grade de libertate de tratament este mai mic decât numărul de eșantioane utilizate sau m - 1. Numărul de grade de libertate de eroare este numărul total de puncte de date, minus numărul de probe sau n - m.
  5. Calculați pătratul mediu de eroare. Se notează MSE = SSE / (n - m).
  6. Calculați pătratul mediu de tratament. Se notează MST = SST /m - „1.
  7. Calculați F statistic. Acesta este raportul celor două pătrate medii pe care le-am calculat. Asa de F = MST / MSE.

Software-ul face toate acestea destul de ușor, dar este bine să știi ce se întâmplă în culise. În ceea ce urmează, elaborăm un exemplu de ANOVA urmând pașii menționați mai sus.

Date și mijloace de eșantion

Să presupunem că avem patru populații independente care îndeplinesc condițiile pentru un singur factor ANOVA. Dorim să testăm ipoteza nulă H0: μ1 = μ2 = μ3 = μ4. Pentru scopurile acestui exemplu, vom folosi un eșantion de dimensiuni trei din fiecare din populațiile studiate. Datele din eșantioanele noastre sunt:

  • Eșantion din populația nr. 1: 12, 9, 12. Aceasta are o medie de 11 ani.
  • Eșantion din populația nr. 2: 7, 10, 13. Aceasta are o medie de 10 ani.
  • Eșantion de la populația nr. 3: 5, 8, 11. Aceasta are o medie de probă de 8.
  • Eșantion din populația nr. 4: 5, 8, 8. Aceasta are o medie de probă de 7.

Media tuturor datelor este de 9.

Suma pătratelor de eroare

Acum calculăm suma abaterilor pătrate de la fiecare probă medie. Aceasta se numește suma pătratelor de eroare.

  • Pentru eșantionul din populația nr. 1: (12 - 11)2 + (9-11)2 +(12 - 11)2 = 6
  • Pentru eșantionul din populația nr. 2: (7-10)2 + (10-10)2 +(13 - 10)2 = 18
  • Pentru eșantionul din populația nr. 3: (5 - 8)2 + (8 - 8)2 +(11 - 8)2 = 18
  • Pentru eșantionul din populația nr. 4: (5 - 7)2 + (8 - 7)2 +(8 - 7)2 = 6.

Adăugăm apoi toate aceste sume de devieri pătrate și obținem 6 + 18 + 18 + 6 = 48.

Suma pătratelor de tratament

Acum calculăm suma pătratelor de tratament. Aici ne uităm la abaterile pătrate ale fiecărei probe medii de la media generală și înmulțim acest număr cu unu mai puțin decât numărul populațiilor:

3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.

Grade de libertate

Înainte de a trece la următorul pas, avem nevoie de gradele de libertate. Există 12 valori ale datelor și patru probe. Astfel, numărul de grade de libertate de tratament este de 4 - 1 = 3. Numărul de grade de libertate de eroare este 12 - 4 = 8.

Pătrate medii

Împărțim acum suma pătratelor la numărul adecvat de grade de libertate pentru a obține pătratele medii.

  • Pătratul mediu pentru tratament este 30/3 = 10.
  • Pătratul mediu pentru eroare este 48/8 = 6.

F-statistică

Ultimul pas în acest sens este împărțirea pătratului mediu pentru tratament la pătratul mediu pentru eroare. Aceasta este statistica F din date. Astfel pentru exemplul nostru F = 10/6 = 5/3 = 1.667.

Tabelele de valori sau software pot fi utilizate pentru a determina cât de probabil este de a obține o valoare a statisticii F la fel de extremă decât această valoare din întâmplare.