Înțelegerea intervalului interquartile în statistici

Gama interquartile (IQR) este diferența dintre primul quartile și al treilea quartile. Formula pentru aceasta este:

IQR = Q3 - Q1

Există multe măsurători ale variabilității unui set de date. Atât intervalul, cât și abaterea standard ne spun cât de răspândite sunt datele noastre. Problema cu aceste statistici descriptive este că sunt destul de sensibile la valori superioare. Măsurarea răspândirii unui set de date care este mai rezistent la prezența valorilor exterioare este intervalul interquartil.

Definiția Interquartile Range

După cum s-a văzut mai sus, intervalul interquartile este construit pe baza calculării altor statistici. Înainte de a determina intervalul interquartile, trebuie să cunoaștem mai întâi valorile primului quartile și al treilea quartile. (Desigur, primul și al treilea quartile depind de valoarea mediană).

După ce am determinat valorile primelor și celei de-a treia quartile, intervalul interquartil este foarte ușor de calculat. Tot ce trebuie să facem este să scădem primul quartil din al treilea quartile. Acest lucru explică utilizarea termenului interval interquartile pentru această statistică.

Exemplu

Pentru a vedea un exemplu de calcul al unui interval interquartil, vom lua în considerare setul de date: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. Rezumatul celor cinci numere pentru acest set de date este:

  • Minim 2
  • Primul quartile de 3,5
  • Mediană de 6
  • Al treilea quartile din 8
  • Maxim 9

Astfel, vedem că intervalul interquartile este 8 - 3,5 = 4,5.

Semnificația intervalului Interquartile

Intervalul ne oferă o măsurare a modului de răspândire a întregului set de date. Gama interquartile, care ne spune cât de distanță sunt primul și al treilea quartile, indică cât de răspândită este mijlocul de 50% din setul nostru de date.

Rezistență la valori superioare

Avantajul principal al utilizării intervalului interquartile, mai degrabă decât a intervalului pentru măsurarea răspândirii unui set de date este faptul că intervalul interquartile nu este sensibil la valori exterioare. Pentru a vedea acest lucru, vom analiza un exemplu.

Din setul de date de mai sus avem un interval inter-filial de 3,5, un interval de 9 - 2 = 7 și o abatere standard de 2,34. Dacă înlocuim cea mai mare valoare de 9 cu o valoare extremă de peste 100, atunci abaterea standard devine 27,37 și intervalul este 98. Chiar dacă avem schimbări destul de drastice ale acestor valori, primul și al treilea quartile nu sunt afectate și, astfel, intervalul interquartil nu se schimba.

Utilizarea gamei Interquartile

Pe lângă faptul că este o măsură mai puțin sensibilă a răspândirii unui set de date, intervalul interquartil are o altă utilizare importantă. Datorită rezistenței sale la valori superioare, intervalul interquartil este util în identificarea când o valoare este mai mare.

Regula intervalului interquartile este ceea ce ne informează dacă avem o intervenție ușoară sau puternică. Pentru a căuta un aspect mai vechi, trebuie să privim sub primul quartile sau deasupra celui de-al treilea quartile. Cât de departe ar trebui să mergem depinde de valoarea intervalului interquartile.