Diferența dintre statistici descriptive și inferențiale

Câmpul statisticii este împărțit în două diviziuni majore: descriptive și inferențiale. Fiecare dintre aceste segmente este important, oferind tehnici diferite care îndeplinesc obiective diferite. Statisticile descriptive descriu ce se întâmplă într-o populație sau set de date. Statisticile inferențiale, prin contrast, permit oamenilor de știință să ia concluzii dintr-un grup de probe și să le generalizeze într-o populație mai mare. Cele două tipuri de statistici au unele diferențe importante.

Statisticile descriptive

Statistica descriptivă este tipul de statistică care răspunde probabil în mintea majorității oamenilor atunci când aud cuvântul „statistici”. În această ramură a statisticilor, obiectivul este de a descrie. Măsurile numerice sunt utilizate pentru a spune despre caracteristicile unui set de date. Există o serie de elemente care aparțin acestei porțiuni de statistici, cum ar fi:

  • Media sau măsura centrului unui set de date, constând din media, mediana, modul sau intervalul mediu
  • Răspândirea unui set de date, care poate fi măsurat cu intervalul sau cu abaterea standard
  • Descrierea generală a datelor, cum ar fi rezumatul celor cinci numere
  • Măsurători, cum ar fi fragilitatea și kurtoza
  • Explorarea relațiilor și corelația dintre datele împerecheate
  • Prezentarea rezultatelor statistice în formă grafică

Aceste măsuri sunt importante și utile, deoarece permit oamenilor de știință să vadă tiparele dintre date și astfel să înțeleagă aceste date. Statisticile descriptive pot fi utilizate numai pentru a descrie populația sau setul de date studiate: Rezultatele nu pot fi generalizate la niciun alt grup sau populație.

Tipuri de statistici descriptive

Există două tipuri de statistici descriptive pe care le folosesc oamenii de știință socială:

Măsurile tendinței centrale surprind tendințele generale în cadrul datelor și sunt calculate și exprimate ca medie, medie și mod. O medie spune oamenilor de știință media matematică a tuturor unui set de date, cum ar fi vârsta medie la prima căsătorie; mediana reprezintă mijlocul distribuției datelor, la fel ca vârsta care se află la mijlocul intervalului de vârstă la care oamenii se căsătoresc pentru prima dată; și, modul ar putea fi cea mai comună vârstă la care oamenii se căsătoresc pentru prima dată.

Măsurile de răspândire descriu modul în care datele sunt distribuite și se raportează între ele, inclusiv:

  • Intervalul, întregul interval de valori prezent într-un set de date
  • Distribuția frecvenței, care definește de câte ori apare o anumită valoare într-un set de date
  • Quartile, subgrupuri formate în cadrul unui set de date atunci când toate valorile sunt împărțite în patru părți egale pe întreaga gamă
  • Media abaterii absolute, media cât de mult se abate fiecare valoare de la medie
  • Varianță, care ilustrează cât de mult există o răspândire în date
  • Abatere standard, care ilustrează răspândirea datelor în raport cu media

Măsurile de răspândire sunt adesea reprezentate vizual în tabele, grafice cu plăcintă și bare și histograme pentru a ajuta la înțelegerea tendințelor din date.

Statistici deduse

Statisticile inferențiale sunt produse prin calcule matematice complexe care permit oamenilor de știință să deducă tendințele unei populații mai mari pe baza unui studiu al unui eșantion prelevat din acesta. Oamenii de știință folosesc statistici inferențiale pentru a examina relațiile dintre variabile dintr-un eșantion și apoi fac generalizări sau predicții despre modul în care se vor raporta acele variabile la o populație mai mare.

De obicei, este imposibil de examinat individual fiecare membru al populației. Deci, oamenii de știință aleg un subset reprezentativ al populației, numit eșantion statistic și, din această analiză, sunt capabili să spună ceva despre populația din care a provenit eșantionul. Există două diviziuni majore ale statisticilor inferențiale:

  • Un interval de încredere oferă o serie de valori pentru un parametru necunoscut al populației prin măsurarea unui eșantion statistic. Aceasta este exprimată în termeni de intervale și gradul de încredere că parametrul se află în interval.
  • Teste de semnificație sau teste de ipoteză în care oamenii de știință formulează o afirmație despre populație prin analizarea unui eșantion statistic. Prin proiectare, există o anumită incertitudine în acest proces. Acest lucru poate fi exprimat în termeni de un nivel de semnificație.

Tehnicile pe care oamenii de știință socială le utilizează pentru a examina relațiile dintre variabile și, astfel, pentru a crea statistici inferențiale, includ analize de regresie liniară, analize de regresie logistică, ANOVA, analize de corelație, modelarea ecuațiilor structurale și analiza supraviețuirii. Atunci când efectuează cercetări folosind statistici inferențiale, oamenii de știință efectuează un test de importanță pentru a determina dacă își pot generaliza rezultatele pentru o populație mai mare. Testele comune de semnificație includ chi-pătratul și testul T. Acestea spun oamenilor de știință probabilitatea ca rezultatele analizei acestora să fie reprezentative pentru populație în ansamblu.

Statistici descriptive vs. inferențiale

Deși statisticile descriptive sunt utile în învățarea unor lucruri precum răspândirea și centrul datelor, nimic din statisticile descriptive nu poate fi folosit pentru a face generalizări. În statisticile descriptive, măsurători precum media și abaterea standard sunt menționate ca numere exacte.

Chiar dacă statisticile inferențiale folosesc unele calcule similare - cum ar fi media și abaterea standard - accentul este diferit pentru statisticile inferențiale. Statisticile inerente încep cu un eșantion și apoi se generalizează la o populație. Aceste informații despre o populație nu sunt menționate ca număr. În schimb, oamenii de știință exprimă acești parametri ca o serie de numere potențiale, împreună cu un grad de încredere.