Unul dintre obiectivele statisticilor este aranjarea datelor într-un mod semnificativ. Tabelele bidirecționale sunt o modalitate importantă de organizare a unui anumit tip de date în pereche. Ca și în cazul construirii oricăror grafice sau tabele din statistici, este foarte important să cunoaștem tipurile de variabile cu care lucrăm. Dacă avem date cantitative, atunci ar trebui să se folosească un grafic, cum ar fi o histogramă sau o tulpină și un complot de frunze. Dacă avem date categorice, atunci este adecvat un grafic cu bare sau un grafic.
Când lucrăm cu date în pereche, trebuie să fim atenți. Există o diagramă de dispersie pentru date cantitative pereche, dar ce tip de grafic există pentru datele categorice împerecheate? Ori de câte ori avem două variabile categorice, atunci ar trebui să folosim un tabel cu două sensuri.
În primul rând, reamintim că datele categorice se referă la trăsături sau la categorii. Nu este cantitativ și nu are valori numerice.
Un tabel cu două sensuri implică listarea tuturor valorilor sau nivelurilor pentru două variabile categorice. Toate valorile pentru una dintre variabile sunt listate într-o coloană verticală. Valorile celeilalte variabile sunt listate de-a lungul unui rând orizontal. Dacă prima variabilă are m valori și a doua variabilă are n valori, atunci vor fi un total de mn intrări în tabel. Fiecare dintre aceste intrări corespunde unei anumite valori pentru fiecare dintre cele două variabile.
De-a lungul fiecărui rând și de-a lungul fiecărei coloane, intrările sunt totalizate. Aceste totalități sunt importante la determinarea distribuțiilor marginale și condiționale. Aceste totalități sunt importante și atunci când efectuăm un test chi-pătrat pentru independență.
De exemplu, vom lua în considerare o situație în care ne uităm la mai multe secțiuni ale unui curs de statistică la o universitate. Vrem să construim un tabel cu două sensuri pentru a determina ce diferențe există, dacă există, între bărbați și femei în curs. Pentru a realiza acest lucru, numărăm numărul fiecărei clase de litere care a fost obținut de membrii fiecărui gen.
Observăm că prima variabilă categorică este cea a genului și există două valori posibile în studiul masculin și feminin. A doua variabilă categorică este cea a notei de litere și există cinci valori care sunt date de A, B, C, D și F. Aceasta înseamnă că vom avea un tabel cu două sensuri cu 2 x 5 = 10 intrări, plus un rând suplimentar și o coloană suplimentară care va fi necesară pentru a tabula totalul rândurilor și coloanelor.
Ancheta noastră arată că:
Aceste informații sunt introduse în tabelul cu două sensuri de mai jos. Totalul fiecărui rând ne spune câte din fiecare grad a fost obținut. Totalul coloanelor ne spune numărul de bărbați și numărul de femei.
Tabelele bidirecționale ne ajută să ne organizăm datele când avem două variabile categorice. Acest tabel poate fi folosit pentru a ne ajuta să comparăm două grupuri diferite din datele noastre. De exemplu, am putea lua în considerare performanța relativă a bărbaților în cursul statisticilor în raport cu performanța femeilor în curs.
După formarea unui tabel cu două sensuri, următorul pas poate fi analizarea datelor statistic. Ne putem întreba dacă variabilele care sunt în studiu sunt independente sau nu. Pentru a răspunde la această întrebare, putem folosi un test chi-pătrat pe tabela cu două sensuri.
Masculin | Femeie | Total | |
A | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Total | 280 | 260 | 540 |