Când este egal devierea standard cu zero?

Abaterea standard a eșantionului este o statistică descriptivă care măsoară răspândirea unui set de date cantitative. Acest număr poate fi orice număr real negativ. Deoarece zero este un număr real non-negativ, pare util să ne întrebăm: „Când va fi abaterea standard a probei egală cu zero?” Acest lucru se întâmplă în cazul foarte special și extrem de neobișnuit când toate valorile datelor noastre sunt exact aceleași. Vom explora motivele pentru care.

Descrierea abaterii standard

Două întrebări importante la care dorim să răspundem de obicei despre un set de date includ:

  • Care este centrul setului de date?
  • Cât de răspândită este setul de date?

Există diferite măsurători, numite statistici descriptive care răspund la aceste întrebări. De exemplu, centrul de date, cunoscut și sub numele de medie, poate fi descris în termeni medii, medii sau moduri. Alte statistici, care sunt mai puțin cunoscute, pot fi utilizate, cum ar fi midhinge sau trimean.

Pentru răspândirea datelor noastre, am putea folosi intervalul, intervalul interquartil sau abaterea standard. Abaterea standard este asociată cu media de a cuantifica răspândirea datelor noastre. Putem folosi apoi acest număr pentru a compara mai multe seturi de date. Cu cât este mai mare abaterea noastră standard, cu atât este mai mare răspândirea.

Intuiţie

Deci, să luăm în considerare din această descriere ce ar însemna să avem o abatere standard de zero. Acest lucru ar indica faptul că nu există deloc o răspândire în setul nostru de date. Toate valorile de date individuale vor fi grupate la o singură valoare. Deoarece ar exista o singură valoare pe care datele noastre ar putea avea-o, această valoare ar constitui media eșantionului nostru.

În această situație, când toate valorile noastre de date sunt aceleași, nu ar exista nicio variație. Intuitiv are sens că abaterea standard a unui astfel de set de date ar fi zero.

Dovadă matematică

Abaterea standard a eșantionului este definită printr-o formulă. Deci orice afirmație precum cea de mai sus ar trebui dovedită folosind această formulă. Începem cu un set de date care se potrivește descrierii de mai sus: toate valorile sunt identice și există n valori egale cu X.

Calculăm media acestui set de date și vedem că este

 X = (X + X +... + X) /n = nx/n = X.

Acum, când calculăm abaterile individuale de la medie, vedem că toate aceste abateri sunt zero. Prin urmare, variația și, de asemenea, deviația standard sunt de asemenea egale cu zero.

Necesar și suficient

Vedem că dacă setul de date nu afișează nicio variație, atunci abaterea standard este zero. Ne putem întreba dacă conversația acestei afirmații este adevărată. Pentru a vedea dacă este, vom folosi din nou formula pentru abaterea standard. De data aceasta, însă, vom seta abaterea standard egală cu zero. Nu vom face nicio presupunere cu privire la setul nostru de date, dar vom vedea ce setare s = 0 implică

Să presupunem că abaterea standard a unui set de date este egală cu zero. Aceasta ar presupune că variația probei s2 este de asemenea egal cu zero. Rezultatul este ecuația:

0 = (1 / (n - 1)) ∑ (Xeu - X )2

Înmulțim ambele părți ale ecuației cu n - 1 și vezi că suma abaterilor pătrate este egală cu zero. Întrucât lucrăm cu numere reale, singura modalitate de a se întâmpla este ca fiecare abatere pătrată să fie egală cu zero. Aceasta înseamnă că pentru fiecare eu, termenul (Xeu - X )2 = 0.

Acum luăm rădăcina pătrată a ecuației de mai sus și vedem că fiecare abatere de la medie trebuie să fie egală cu zero. De vreme ce pentru toate eu,

Xeu - X = 0

Aceasta înseamnă că fiecare valoare a datelor este egală cu media. Acest rezultat împreună cu cel de mai sus ne permite să spunem că deviația standard a unui set de date este zero dacă și numai dacă toate valorile sale sunt identice.