Câmpul statisticii este împărțit în două diviziuni majore: descriptive și inferențiale. Fiecare dintre aceste segmente este important, oferind tehnici diferite care îndeplinesc obiective diferite. Statisticile descriptive descriu ce se întâmplă într-o populație sau set de date. Statisticile inferențiale, prin contrast, permit oamenilor de știință să ia concluzii dintr-un grup de probe și să le generalizeze într-o populație mai mare. Cele două tipuri de statistici au unele diferențe importante.
Statistica descriptivă este tipul de statistică care răspunde probabil în mintea majorității oamenilor atunci când aud cuvântul „statistici”. În această ramură a statisticilor, obiectivul este de a descrie. Măsurile numerice sunt utilizate pentru a spune despre caracteristicile unui set de date. Există o serie de elemente care aparțin acestei porțiuni de statistici, cum ar fi:
Aceste măsuri sunt importante și utile, deoarece permit oamenilor de știință să vadă tiparele dintre date și astfel să înțeleagă aceste date. Statisticile descriptive pot fi utilizate numai pentru a descrie populația sau setul de date studiate: Rezultatele nu pot fi generalizate la niciun alt grup sau populație.
Există două tipuri de statistici descriptive pe care le folosesc oamenii de știință socială:
Măsurile tendinței centrale surprind tendințele generale în cadrul datelor și sunt calculate și exprimate ca medie, medie și mod. O medie spune oamenilor de știință media matematică a tuturor unui set de date, cum ar fi vârsta medie la prima căsătorie; mediana reprezintă mijlocul distribuției datelor, la fel ca vârsta care se află la mijlocul intervalului de vârstă la care oamenii se căsătoresc pentru prima dată; și, modul ar putea fi cea mai comună vârstă la care oamenii se căsătoresc pentru prima dată.
Măsurile de răspândire descriu modul în care datele sunt distribuite și se raportează între ele, inclusiv:
Măsurile de răspândire sunt adesea reprezentate vizual în tabele, grafice cu plăcintă și bare și histograme pentru a ajuta la înțelegerea tendințelor din date.
Statisticile inferențiale sunt produse prin calcule matematice complexe care permit oamenilor de știință să deducă tendințele unei populații mai mari pe baza unui studiu al unui eșantion prelevat din acesta. Oamenii de știință folosesc statistici inferențiale pentru a examina relațiile dintre variabile dintr-un eșantion și apoi fac generalizări sau predicții despre modul în care se vor raporta acele variabile la o populație mai mare.
De obicei, este imposibil de examinat individual fiecare membru al populației. Deci, oamenii de știință aleg un subset reprezentativ al populației, numit eșantion statistic și, din această analiză, sunt capabili să spună ceva despre populația din care a provenit eșantionul. Există două diviziuni majore ale statisticilor inferențiale:
Tehnicile pe care oamenii de știință socială le utilizează pentru a examina relațiile dintre variabile și, astfel, pentru a crea statistici inferențiale, includ analize de regresie liniară, analize de regresie logistică, ANOVA, analize de corelație, modelarea ecuațiilor structurale și analiza supraviețuirii. Atunci când efectuează cercetări folosind statistici inferențiale, oamenii de știință efectuează un test de importanță pentru a determina dacă își pot generaliza rezultatele pentru o populație mai mare. Testele comune de semnificație includ chi-pătratul și testul T. Acestea spun oamenilor de știință probabilitatea ca rezultatele analizei acestora să fie reprezentative pentru populație în ansamblu.
Deși statisticile descriptive sunt utile în învățarea unor lucruri precum răspândirea și centrul datelor, nimic din statisticile descriptive nu poate fi folosit pentru a face generalizări. În statisticile descriptive, măsurători precum media și abaterea standard sunt menționate ca numere exacte.
Chiar dacă statisticile inferențiale folosesc unele calcule similare - cum ar fi media și abaterea standard - accentul este diferit pentru statisticile inferențiale. Statisticile inerente încep cu un eșantion și apoi se generalizează la o populație. Aceste informații despre o populație nu sunt menționate ca număr. În schimb, oamenii de știință exprimă acești parametri ca o serie de numere potențiale, împreună cu un grad de încredere.