Nu toate datele sunt create în mod egal. Este util să clasificați seturile de date după diferite criterii. Unele sunt cantitative, iar altele sunt calitative. Unele seturi de date sunt continue, altele sunt discrete.
Un alt mod de a separa datele este de a le clasifica în patru niveluri de măsurare: nominal, ordinal, interval și raport. Niveluri diferite de măsurare necesită tehnici statistice diferite. Vom analiza fiecare dintre aceste niveluri de măsurare.
Nivelul nominal de măsurare este cel mai mic dintre cele patru moduri de caracterizare a datelor. Nominal înseamnă „doar în nume” și asta ar trebui să ne ajute să ne amintim despre ce este vorba. Datele nominale tratează nume, categorii sau etichete.
Datele la nivel nominal sunt calitative. Culorile ochilor, răspunsurile da sau nu la un sondaj și cerealele preferate pentru micul dejun se referă la nivelul nominal de măsurare. Chiar și unele lucruri cu numere asociate acestora, cum ar fi un număr din spatele unui tricou de fotbal, sunt nominale, deoarece este folosit pentru a „numi” un jucător individual pe teren..
Datele la acest nivel nu pot fi ordonate într-un mod semnificativ și nu are sens să calculăm lucruri precum mijloacele și abaterile standard.
Următorul nivel se numește nivel ordinal de măsurare. Datele de la acest nivel pot fi comandate, dar nu pot fi luate diferențe între date care au sens.
Aici ar trebui să vă gândiți la lucruri precum o listă a primelor zece orașe de trăit. Datele, aici zece orașe, sunt clasificate de la unu la zece, dar diferențele dintre orașe nu prea au sens. Nu ai cum să te uiți doar la clasament pentru a ști cât de mult este mai bună viața în numărul 1 al orașului decât numărul 2 al orașului.
Un alt exemplu în acest sens sunt notele de litere. Puteți comanda lucruri astfel încât A să fie mai mare decât B, dar fără alte informații, nu există nicio modalitate de a ști cât de bine este un A de la un B.
Ca și în cazul nominalului, datele la nivel ordinal nu trebuie utilizate în calcul.
Nivelul intervalului de măsurare tratează datele care pot fi comandate și în care diferențele dintre date au sens. Datele la acest nivel nu au un punct de plecare.
Scala de temperaturi Fahrenheit și Celsius sunt ambele exemple de date la nivelul intervalului de măsurare. Puteți vorbi despre 30 de grade fiind cu 60 de grade mai puțin de 90 de grade, deci diferențele au sens. Cu toate acestea, 0 grade (în ambele scale), rece, așa cum este, nu reprezintă absența totală a temperaturii.
Datele la nivel de interval pot fi utilizate în calcule. Cu toate acestea, datele de la acest nivel nu au un tip de comparație. Chiar dacă 3 x 30 = 90, nu este corect să spunem că 90 de grade Celsius este de trei ori mai cald decât 30 de grade Celsius.
Al patrulea și cel mai înalt nivel de măsurare este nivelul raportului. Datele la nivelul raportului posedă toate caracteristicile nivelului intervalului, pe lângă o valoare zero. Datorită prezenței unui zero, acum are sens să comparăm raporturile măsurătorilor. Fraze precum „de patru ori” și „de două ori” sunt semnificative la nivelul raportului.
Distanțele, în orice sistem de măsurare, ne oferă date la nivelul raportului. O măsurătoare precum 0 picioare are sens, deoarece nu reprezintă lungimea. În plus, 2 picioare este de două ori mai lung decât 1 picior. Deci se pot forma raporturi între date.
La nivelul raportului de măsurare, nu numai că pot fi calculate sume și diferențe, dar și raporturi. O măsurătoare poate fi împărțită la orice măsurătoare zero și va rezulta un număr semnificativ.
Având în vedere o listă de numere de securitate socială, este posibil să faceți tot felul de calcule cu ele, dar nici unul dintre aceste calcule nu oferă nimic semnificativ. Care este un număr de securitate socială împărțit la altul? O pierdere completă de timp, deoarece numerele de securitate socială sunt la nivelul nominal de măsurare.
Când vi se oferă unele date, gândiți-vă inainte de calculezi. Nivelul de măsurare cu care lucrezi va determina ce sens are să faci.