Care este rezumatul celor 5 numere?

Există o varietate de statistici descriptive. Numere cum ar fi media, mediul, modul, netezimea, kurtoza, abaterea standard, primul quartil și al treilea quartile, pentru a numi câteva, fiecare ne spune ceva despre datele noastre. Decât să ne uităm individual la aceste statistici descriptive, uneori combinarea acestora ne ajută să ne oferim o imagine completă. În acest scop, rezumatul format din cinci numere este o modalitate convenabilă de a combina cinci statistici descriptive.

Care cinci numere?

Este clar că trebuie să existe cinci numere în rezumatul nostru, dar care cinci? Numerele alese trebuie să ne ajute să cunoaștem centrul datelor noastre, precum și modul de răspândire a punctelor de date. În acest sens, rezumatul format din cinci numere constă din următoarele:

  • Minima - aceasta este cea mai mică valoare din setul nostru de date.
  • Primul quartile - acest număr este notat Q1 iar 25% din datele noastre se încadrează sub primul quartile.
  • Mediana - acesta este punctul intermediar al datelor. 50% din toate datele se situează sub mediană.
  • Al treilea quartile - acest număr este notat Q3 iar 75% din datele noastre se încadrează sub al treilea quartile.
  • Maximul - aceasta este cea mai mare valoare din setul nostru de date.

Media și abaterea standard pot fi de asemenea utilizate împreună pentru a transmite centrul și răspândirea unui set de date. Totuși, ambele statistici sunt sensibile la valori superioare. Mediul, primul quartile și al treilea quartile nu sunt la fel de puternic influențate de valorile exterioare.

Un exemplu

Având în vedere următorul set de date, vom raporta rezumatul celor cinci numere:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Există în total douăzeci de puncte în setul de date. Mediana este astfel media a zecea și a unsprezecea valoare de date sau:

(7 + 8) / 2 = 7,5.

Mediana jumătății de jos a datelor este primul quartile. Jumătatea de jos este:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Astfel calculămQ1= (4 + 6) / 2 = 5.

Mediana jumătății superioare a setului de date originale este al treilea quartile. Trebuie să găsim mediana de:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Astfel calculămQ3= (15 + 15) / 2 = 15.

Reunim toate rezultatele de mai sus și raportăm că cele cinci numere rezumate pentru setul de date de mai sus sunt 1, 5, 7.5, 12, 20.

Reprezentare grafică

Se pot compara cinci rezumate cu numărul. Vom afla că două seturi cu mijloace similare și abateri standard pot avea rezumate de cinci numere foarte diferite. Pentru a compara cu ușurință două rezumate cu cinci numere dintr-o privire, putem utiliza un grafic boxplot sau box și whiskers.