Eșantionarea statistică este folosită destul de des în statistici. În acest proces, ne propunem să determinăm ceva despre o populație. Deoarece populațiile au dimensiuni de obicei mari, formăm un eșantion statistic prin selectarea unui subset de populație care are o dimensiune predeterminată. Studiind eșantionul putem folosi statistici inferențiale pentru a determina ceva despre populație.
Un eșantion statistic de dimensiuni n implică un singur grup de n indivizi sau subiecți care au fost aleși la întâmplare din populație. În strânsă legătură cu conceptul de eșantion statistic este o distribuție de eșantionare.
O distribuție de eșantionare are loc atunci când formăm mai mult de un eșantion simplu aleatoriu de aceeași dimensiune dintr-o populație dată. Aceste probe sunt considerate independente unele de altele. Deci, dacă un individ se află într-un singur eșantion, atunci are aceeași probabilitate de a fi în următorul eșantion care este luat.
Calculăm o statistică particulară pentru fiecare eșantion. Aceasta poate fi o medie a eșantionului, o variație a probei sau o proporție de eșantion. Deoarece o statistică depinde de eșantionul pe care îl avem, fiecare eșantion va produce de obicei o valoare diferită pentru statistică de interes. Gama de valori care au fost produse este ceea ce ne oferă distribuția noastră de eșantionare.
De exemplu, vom avea în vedere distribuția eșantionului pentru medie. Media unei populații este un parametru care este de obicei necunoscut. Dacă selectăm un eșantion cu dimensiunea 100, atunci media acestui eșantion se calculează ușor adăugând toate valorile împreună și apoi împărțind la numărul total de puncte de date, în acest caz, 100. Un eșantion cu dimensiunea 100 ne poate oferi o medie 50. Un alt astfel de eșantion poate avea o medie de 49. Alți 51 și un alt eșantion pot avea 50,5.
Distribuția acestor mijloace de eșantion ne oferă o distribuție de eșantionare. Am dori să luăm în considerare mai mult de doar patru mijloace de probă așa cum am făcut mai sus. Cu mai multe mijloace de eșantion, vom avea o idee bună despre forma distribuției eșantionului.
Eșantionarea Distribuțiile pot părea destul de abstracte și teoretice. Cu toate acestea, există unele consecințe foarte importante în urma utilizării acestora. Unul dintre avantajele principale este că eliminăm variabilitatea prezentă în statistici.
De exemplu, să presupunem că începem cu o populație cu o medie de μ și deviație standard de σ. Abaterea standard ne oferă o măsurătoare a distribuției. Vom compara acest lucru cu o distribuție de eșantionare obținută prin formarea de eșantioane simple aleatoare de mărime n. Distribuția de eșantionare a mediei va avea în continuare o medie de μ, dar abaterea standard este diferită. Abaterea standard pentru o distribuție de eșantionare devine σ / √ n.
Avem astfel următoarele
În practica statisticilor, rareori formăm distribuții de eșantionare. În schimb, tratăm statisticile obținute dintr-un simplu eșantion aleatoriu de dimensiuni n ca și cum ar fi un punct de-a lungul unei distribuții de eșantionare corespunzătoare. Acest lucru subliniază din nou motivul pentru care dorim să avem dimensiuni de eșantion relativ mari. Cu cât este mai mare dimensiunea eșantionului, cu atât variația este mai mică pe care o vom obține în statisticile noastre.
Rețineți că, în afară de centru și răspândire, nu putem spune nimic despre forma distribuției noastre de eșantionare. Se dovedește că în anumite condiții destul de largi, Teorema Limitului Central poate fi aplicată pentru a ne spune ceva destul de uimitor despre forma distribuției de eșantionare.