Varianță și abatere standard

Când măsurăm variabilitatea unui set de date, există două statistici strâns legate legate de aceasta: variația și abaterea standard, care indică ambele moduri de extindere a valorilor datelor și implică pași similari în calculul lor. Cu toate acestea, diferența majoră dintre aceste două analize statistice este că abaterea standard este rădăcina pătrată a variației.

Pentru a înțelege diferențele dintre aceste două observații ale răspândirii statistice, trebuie mai întâi să înțelegem ce reprezintă fiecare: Varianța reprezintă toate punctele de date dintr-un set și se calculează prin medierea abaterii pătrate a fiecărei medii, în timp ce abaterea standard este o măsură de răspândire. în jurul valorii medii când tendința centrală este calculată prin medie.

Drept urmare, variația poate fi exprimată ca abaterea medie pătrată a valorilor de la mijloc sau [abaterea pătrată a mijloacelor] divizată la numărul de observații și abaterea standard poate fi exprimată ca rădăcina pătrată a varianței.

Construcția Varianței

Pentru a înțelege pe deplin diferența dintre aceste statistici, trebuie să înțelegem calculul variației. Pașii pentru calcularea variației probei sunt următorii:

  1. Calculați media probei pentru date.
  2. Găsiți diferența dintre media și fiecare dintre valorile datelor.
  3. Pătrate aceste diferențe.
  4. Adăugați diferențele pătrate împreună.
  5. Împărțiți această sumă la una mai mică decât numărul total de valori ale datelor.

Motivele pentru fiecare dintre acești pași sunt următoarele:

  1. Media furnizează punctul central sau media datelor.
  2. Diferențele față de medie ajută la determinarea abaterilor de la această medie. Valorile datelor care sunt departe de medie vor produce o abatere mai mare decât cele apropiate de medie.
  3. Diferențele sunt pătrate, deoarece dacă se adaugă diferențele fără a fi pătrat, această sumă va fi zero.
  4. Adăugarea acestor abateri pătrate oferă o măsurare a abaterii totale.
  5. Împărțirea cu unu mai puțin decât dimensiunea eșantionului oferă un fel de abatere medie. Acest lucru neagă efectul ca multe puncte de date să contribuie fiecare la măsurarea răspândirii.

După cum s-a menționat anterior, abaterea standard este calculată pur și simplu prin găsirea rădăcinii pătrate a acestui rezultat, ceea ce oferă standardul absolut de abatere indiferent de un număr total de valori ale datelor.

Varianță și abatere standard

Când luăm în considerare variația, ne dăm seama că există un dezavantaj major în utilizarea acesteia. Când urmăm pașii calculului variației, acest lucru arată că variația este măsurată în termeni de unități pătrate, deoarece am adăugat împreună diferențe pătrate în calculul nostru. De exemplu, dacă datele noastre de eșantion sunt măsurate în termeni de contori, unitățile pentru o varianță ar fi date în metri pătrați.

Pentru a ne standardiza măsura de răspândire, trebuie să luăm rădăcina pătrată a variației. Acest lucru va elimina problema unităților pătrate și ne oferă o măsură a răspândirii care va avea aceleași unități ca și eșantionul nostru inițial.

Există multe formule în statistici matematice, care au forme de aspect mai frumos atunci când le afirmăm în termeni de variație în loc de abatere standard.