Ce este o gamă de statistici?

În statistică și matematică, intervalul este diferența dintre valorile maxime și minime ale unui set de date și servește ca una dintre cele două caracteristici importante ale unui set de date. Formula pentru un interval este valoarea maximă minus valoarea minimă din setul de date, care oferă statisticienilor o mai bună înțelegere a cât de variate sunt setul de date.

Două caracteristici importante ale unui set de date includ centrul datelor și răspândirea datelor, iar centrul poate fi măsurat în mai multe moduri: cele mai populare dintre acestea sunt mediul, mediana, modul și intervalul mediu, dar în o mod similar, există diferite moduri de a calcula modul de răspândire a setului de date, iar cea mai ușoară și crudă măsură de răspândire se numește intervalul.

Calculul intervalului este foarte simplu. Tot ce trebuie să facem este să găsim diferența dintre cea mai mare valoare a datelor din setul nostru și cea mai mică valoare a datelor. Afirmată succint avem următoarea formulă: Interval = Valoarea maximă-Valoarea minimă. De exemplu, setul de date 4,6,10, 15, 18 are un maxim de 18, un minim de 4 și un interval de 18-4 = 14.

Limitări ale intervalului

Intervalul este o măsurare foarte brută a răspândirii de date, deoarece este extrem de sensibil la valori superioare și, ca urmare, există anumite limitări la utilitatea unui adevărat interval de date setat pentru statistici, deoarece o valoare unică a datelor poate afecta foarte mult valoarea intervalului.

De exemplu, luați în considerare setul de date 1, 2, 3, 4, 6, 7, 7, 8. Valoarea maximă este 8, minimul este 1 și intervalul este 7. Atunci luați în considerare același set de date, numai cu valoarea 100 inclusă. Gama devine acum 100-1 = 99 în care adăugarea unui singur punct suplimentar de date a afectat considerabil valoarea intervalului. Abaterea standard este o altă măsură a răspândirii care este mai puțin sensibilă la valori superioare, dar dezavantajul este că calculul abaterii standard este mult mai complicat.

De asemenea, gama nu ne spune nimic despre caracteristicile interne ale setului nostru de date. De exemplu, considerăm setul de date 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 unde intervalul pentru acest set de date este 10-1 = 9. Dacă apoi comparăm acest lucru cu setul de date de 1, 1, 1, 2, 9, 9, 9, 10. Aici intervalul este, din nou, nouă, totuși, pentru acest al doilea set și spre deosebire de primul set, datele este grupat în jurul valorii de minim și maxim. Alte statistici, cum ar fi primul și al treilea quartile, ar trebui să fie utilizate pentru a detecta o parte din această structură internă.

Aplicații de gamă

Intervalul este o modalitate bună de a înțelege foarte bine modul în care numerele răspândite în setul de date sunt într-adevăr, deoarece este ușor de calculat, deoarece necesită doar o operație aritmetică de bază, dar există și alte câteva aplicații ale gamei de un set de date în statistici.

Intervalul poate fi folosit și pentru a estima o altă măsură a răspândirii, abaterea standard. În loc să parcurgem o formulă destul de complicată pentru a găsi abaterea standard, putem folosi în schimb ceea ce se numește regula intervalului. Intervalul este fundamental în acest calcul.

Intervalul apare, de asemenea, într-un boxplot sau într-un complot box și whiskers. Valorile maxime și minime sunt ambele grefate la sfârșitul biciurilor graficului, iar lungimea totală a biciurilor și a casetei este egală cu intervalul.