Care este inegalitatea lui Chebyshev?

Inegalitatea lui Chebyshev spune că cel puțin 1-1 /K2 datele dintr-un eșantion trebuie să se încadreze K abateri standard de la medie (aici K este orice număr real pozitiv mai mare decât unul).

Orice set de date care este distribuit în mod normal, sau sub forma unei curbe de clopot, are mai multe caracteristici. Una dintre ele se ocupă de răspândirea datelor în raport cu numărul de abateri standard de la medie. Într-o distribuție normală, știm că 68% din date sunt o abatere standard de la medie, 95% sunt două abateri standard de la medie și aproximativ 99% se află în trei abateri standard față de medie.

Dar dacă setul de date nu este distribuit sub forma unei curbe de clopot, atunci o cantitate diferită ar putea fi într-o abatere standard. Inegalitatea lui Chebyshev oferă o modalitate de a ști ce fracție de date se încadrează K abateri standard de la media pentru orice set de date.

Fapte despre inegalitate

De asemenea, putem afirma inegalitatea de mai sus prin înlocuirea sintagmei „date dintr-un eșantion” cu distribuția probabilității. Acest lucru se datorează faptului că inegalitatea lui Chebyshev este rezultatul probabilității, care poate fi apoi aplicată statisticilor.

Este important de menționat că această inegalitate este un rezultat care a fost dovedit matematic. Nu este ca relația empirică dintre medie și modul sau regula degetul mare care leagă intervalul și abaterea standard.

Ilustrația inegalității

Pentru a ilustra inegalitatea, îl vom analiza pentru câteva valori K:

  • Pentru K = 2 avem 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Deci, inegalitatea lui Chebyshev spune că cel puțin 75% din valorile de date ale oricărei distribuții trebuie să se încadreze în două abateri standard ale mediei.
  • Pentru K = 3 avem 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Deci, inegalitatea lui Chebyshev spune că cel puțin 89% din valorile de date ale oricărei distribuții trebuie să se încadreze în trei abateri standard ale mediei.
  • Pentru K = 4 avem 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93,75%. Deci, inegalitatea lui Chebyshev spune că cel puțin 93,75% din valorile datelor ale oricărei distribuții trebuie să se încadreze în două abateri standard ale mediei.

Exemplu

Să presupunem că am prelevat greutatea câinilor în adăpostul local pentru animale și am constatat că eșantionul nostru are o medie de 20 de kilograme cu o abatere standard de 3 kilograme. Prin utilizarea inegalității lui Chebyshev, știm că cel puțin 75% din câinii pe care i-am făcut eșantion au greutăți care reprezintă două abateri standard de la medie. De două ori deviația standard ne oferă 2 x 3 = 6. Reduceți și adăugați asta de la media de 20. Aceasta ne spune că 75% dintre câini au greutate de la 14 kilograme la 26 de kilograme.

Utilizarea inegalității

Dacă știm mai multe despre distribuția cu care lucrăm, atunci de obicei putem garanta că mai multe date sunt un anumit număr de abateri standard departe de medie. De exemplu, dacă știm că avem o distribuție normală, atunci 95% din date reprezintă două abateri standard de la medie. Inegalitatea lui Chebyshev spune că în această situație știm asta macar 75% din date reprezintă două abateri standard de la medie. După cum putem vedea în acest caz, ar putea fi mult mai mult decât acest 75%.

Valoarea inegalității este că ne oferă un scenariu „în caz mai rău” în care singurele lucruri pe care le cunoaștem despre datele noastre de eșantion (sau distribuția probabilităților) sunt media și abaterea standard. Când nu știm nimic altceva despre datele noastre, inegalitatea lui Chebyshev oferă o perspectivă suplimentară asupra modului de răspândire a setului de date.

Istoria inegalității

Inegalitatea poartă numele matematicianului rus Pafnuty Chebyshev, care a afirmat pentru prima dată inegalitatea fără dovezi în 1874. Zece ani mai târziu, inegalitatea a fost dovedită de Markov în doctoratul său. disertație. Datorită variațiilor în modul de reprezentare a alfabetului rus în engleză, Chebyshev este, de asemenea, scris ca Tchebysheff.