Datele asociate în statistici, denumite adesea perechi ordonate, se referă la două variabile la indivizii unei populații care sunt legate între ele pentru a determina corelația dintre ele. Pentru ca un set de date să fie considerat date în pereche, ambele valori trebuie să fie atașate sau legate între ele și nu trebuie luate în considerare separat.
Ideea de date în pereche este contrastată cu asocierea obișnuită a unui număr la fiecare punct de date, ca și în alte seturi de date cantitative, prin faptul că fiecare punct de date individual este asociat cu două numere, oferind un grafic care permite statisticienilor să observe relația dintre aceste variabile în o populatie.
Această metodă de date în pereche este folosită atunci când un studiu speră să compare două variabile la indivizii din populație pentru a trage un fel de concluzie despre corelația observată. La respectarea acestor puncte de date, ordinea împerecherii este importantă, deoarece primul număr este o măsură a unui lucru, în timp ce al doilea este o măsură a cu totul altceva.
Pentru a vedea un exemplu de date în pereche, să presupunem că un profesor numără numărul de sarcini pentru fiecare casă pentru fiecare unitate și apoi împerechează acest număr cu procentul fiecărui elev la testul unității. Perechile sunt următoarele:
În fiecare dintre aceste seturi de date în pereche, putem vedea că numărul de misiuni vine întotdeauna pe primul loc în perechea comandată, în timp ce procentul câștigat la test vine pe locul doi, așa cum se vede în prima instanță de (10, 95%).
În timp ce o analiză statistică a acestor date ar putea fi, de asemenea, utilizată pentru a calcula numărul mediu de sarcini de temă efectuate sau scorul mediu de testare, pot exista și alte întrebări pentru a pune informațiile. În acest caz, profesorul dorește să știe dacă există vreo legătură între numărul de sarcini pentru activități la domiciliu și performanța la test, iar profesorul ar trebui să păstreze datele împerecheate pentru a răspunde la această întrebare..
Tehnicile statistice de corelație și regresie sunt utilizate pentru a analiza datele împerecheate în care coeficientul de corelație cuantifică cât de strânsă datele se află de-a lungul unei linii drepte și măsoară puterea relației liniare.
Pe de altă parte, regresia este folosită pentru mai multe aplicații, inclusiv pentru a determina care linie se potrivește cel mai bine pentru setul nostru de date. La rândul său, această linie poate fi folosită pentru a estima sau prezice y valori pentru valori ale X care nu făceau parte din setul nostru original de date.
Există un tip special de grafic, care este deosebit de potrivit pentru datele în pereche numite scatterplot. În acest tip de grafic, o axă de coordonate reprezintă o cantitate de date împerecheate, în timp ce cealaltă axă de coordonate reprezintă cealaltă cantitate de date împerecheate.
O diagramă de dispersie pentru datele de mai sus ar avea ca axa x să indice numărul de sarcini transformate în timp ce axa y ar indica scorurile la testul unității.