Unul dintre numeroasele moduri în care variabilele din statistici pot fi clasificate este să ia în considerare diferențele dintre variabilele explicative și cele de răspuns. Deși aceste variabile sunt legate, există diferențe importante între ele. După definirea acestor tipuri de variabile, vom vedea că identificarea corectă a acestor variabile are o influență directă asupra altor aspecte ale statisticilor, cum ar fi construcția unei planșe de dispersie și panta unei linii de regresie.
Începem prin a privi definițiile acestor tipuri de variabile. O variabilă de răspuns este o cantitate particulară despre care punem o întrebare în studiul nostru. O variabilă explicativă este orice factor care poate influența variabila de răspuns. Deși pot exista multe variabile explicative, ne vom preocupa în primul rând de o singură variabilă explicativă.
O variabilă de răspuns poate să nu fie prezentă într-un studiu. Denumirea acestui tip de variabilă depinde de întrebările adresate de un cercetător. Efectuarea unui studiu de observație ar fi un exemplu de instanță atunci când nu există o variabilă de răspuns. Un experiment va avea o variabilă de răspuns. Proiectarea atentă a unui experiment încearcă să stabilească că modificările dintr-o variabilă de răspuns sunt cauzate direct de modificările variabilelor explicative.
Pentru a explora aceste concepte vom examina câteva exemple. Pentru primul exemplu, să presupunem că un cercetător este interesat să studieze starea de spirit și atitudinile unui grup de studenți din primul an. Tuturor studenților din anul I li se oferă o serie de întrebări. Aceste întrebări sunt concepute pentru a evalua gradul de rău al locuinței unui student. Studenții indică, de asemenea, în sondaj cât de departe este colegiul lor de acasă.
Un cercetător care examinează aceste date poate fi interesat doar de tipurile de răspunsuri ale elevilor. Poate că motivul pentru aceasta este să ai un sens general în ceea ce privește compoziția unui nou boboc. În acest caz, nu există o variabilă de răspuns. Acest lucru se datorează faptului că nimeni nu vede dacă valoarea unei variabile influențează valoarea altei.
Un alt cercetător ar putea folosi aceleași date pentru a încerca să răspundă dacă studenții veniți de mai departe aveau un grad mai mare de locuință. În acest caz, datele referitoare la întrebările privind lipsa de domiciliu sunt valorile unei variabile de răspuns, iar datele care indică distanța față de casă formează variabila explicativă.
Pentru al doilea exemplu, am putea fi curioși dacă numărul de ore petrecute pentru a face temele are un efect asupra notei pe care un elev o câștigă la un examen. În acest caz, deoarece arătăm că valoarea unei variabile modifică valoarea alteia, există o variabilă explicativă și una de răspuns. Numărul de ore studiat este variabila explicativă, iar scorul la test este variabila de răspuns.
Atunci când lucrăm cu date cantitative în pereche, este indicat să utilizăm un scatterplot. Scopul acestui tip de grafic este de a demonstra relațiile și tendințele din datele asociate. Nu este necesar să avem atât o variabilă explicativă, cât și una de răspuns. Dacă acesta este cazul, atunci orice variabilă poate fi reprezentată de-a lungul ambelor axe. Cu toate acestea, în cazul în care există o variabilă de răspuns și explicativă, atunci variabila explicativă este întotdeauna reprezentată de-a lungul X sau axa orizontală a unui sistem de coordonate carteziene. Variabila de răspuns este apoi reprezentată de-a lungul y axă.
Distincția dintre variabilele explicative și răspuns este similară cu o altă clasificare. Uneori ne referim la variabile ca fiind independente sau dependente. Valoarea unei variabile dependente se bazează pe cea a unei variabile independente. Astfel, o variabilă de răspuns corespunde unei variabile dependente, în timp ce o variabilă explicativă corespunde unei variabile independente. Această terminologie nu este de obicei folosită în statistici, deoarece variabila explicativă nu este cu adevărat independentă. În schimb, variabila preia doar valorile observate. Este posibil să nu avem niciun control asupra valorilor unei variabile explicative.