Unul dintre obiectivele statisticilor este organizarea și afișarea datelor. De multe ori, o modalitate de a face acest lucru este utilizarea unui grafic, grafic sau tabel. Când lucrați cu date în pereche, un tip util de grafic este un scatterplot. Acest tip de grafic ne permite să explorăm ușor și eficient datele noastre examinând o împrăștiere de puncte în plan.
Merită subliniat faptul că o diagramă de dispersie este un tip de grafic care este utilizat pentru date în pereche. Acesta este un tip de set de date în care fiecare dintre punctele noastre de date are două numere asociate cu acesta. Exemple obișnuite de astfel de împerecheri includ:
Pânza goală cu care vom începe pentru scatterplot-ul nostru este sistemul de coordonate carteziene. Acest lucru se numește și sistem de coordonate dreptunghiulare datorită faptului că fiecare punct poate fi localizat prin desenarea unui anumit dreptunghi. Un sistem dreptunghiular de coordonate poate fi creat de:
Acum putem complota punctele noastre de date. Primul număr din perechea noastră este X-coordona. Este distanța orizontală distanță de axa y, și de aici și originea. Ne deplasăm spre dreapta pentru valori pozitive ale X și la stânga originii pentru valori negative ale X.
Al doilea număr din perechea noastră este y-coordona. Este distanța verticală față de axa x. Începând de la punctul inițial din X-axa, deplasați-vă pentru valori pozitive ale y și în jos pentru valori negative ale y.
Locația din graficul nostru este apoi marcată cu un punct. Repetăm acest proces de mai multe ori pentru fiecare punct din setul nostru de date. Rezultatul este o împrăștiere a punctelor, care dă numele scatter-ului său.
O instrucțiune importantă care rămâne este să fie atentă ce variabilă se află pe axa. Dacă datele noastre împerecheate constau dintr-o asociere explicativă și de răspuns, atunci variabila explicativă este indicată pe axa x. Dacă ambele variabile sunt considerate a fi explicative, atunci putem alege care este reprezentată pe axa x și pe care pe y-axă.
Există câteva caracteristici importante ale unui scatterplot. Identificând aceste trăsături putem descoperi mai multe informații despre setul nostru de date. Aceste caracteristici includ:
Scatterploturile care prezintă o tendință liniară pot fi analizate cu tehnicile statistice de regresie și corelare liniară. Regresia poate fi efectuată pentru alte tipuri de tendințe care nu sunt liniare.