Testarea ipotezei este un proces științific răspândit utilizat în discipline științifice statistice și sociale. În studiul statisticilor, un rezultat semnificativ statistic (sau unul cu semnificație statistică) într-un test de ipoteză este obținut atunci când valoarea p este mai mică decât nivelul de semnificație definit. Valoarea p este probabilitatea obținerii unei statistici de testare sau a unui rezultat de eșantion la fel de extrem sau mai extrem decât cel observat în studiu, în timp ce nivelul de semnificație sau alfa spune unui cercetător cât de multe rezultate trebuie să fie respinse pentru a respinge ipoteza nulă. Cu alte cuvinte, dacă valoarea p este egală cu sau mai mică decât nivelul de semnificație definit (de obicei notat de α), cercetătorul poate presupune în siguranță că datele observate sunt incompatibile cu presupunerea că ipoteza nulă este adevărată, ceea ce înseamnă că ipoteza nulă sau premisa că nu există nicio relație între variabilele testate pot fi respinse.
Respingând sau respingând ipoteza nulă, un cercetător ajunge la concluzia că există o bază științifică pentru a crede că există o oarecare relație între variabile și că rezultatele nu s-au datorat erorii de eșantionare sau întâmplării. Deși respingerea ipotezei nule este un obiectiv central în majoritatea studiului științific, este important de menționat că respingerea ipotezei nule nu este echivalentă cu dovada alternativei ipotezei cercetătorului.
Conceptul de semnificație statistică este fundamental pentru testarea ipotezelor. Într-un studiu care implică extragerea unui eșantion aleatoriu dintr-o populație mai mare, în efortul de a demonstra un rezultat care poate fi aplicat populației în ansamblu, există potențialul constant pentru datele studiului să fie rezultatul unei erori de eșantionare sau a unei simple coincidențe. sau întâmplător. Determinând un nivel de semnificație și testând valoarea p cu acesta, un cercetător poate susține sau respinge cu încredere ipoteza nulă. Nivelul de semnificație, în cel mai simplu dintre termeni, este pragul de probabilitate de a respinge greșit ipoteza nulă atunci când este de fapt adevărat. Aceasta este cunoscută și ca rata de eroare de tip I. Prin urmare, nivelul de semnificație sau alfa este asociat cu nivelul general de încredere al testului, ceea ce înseamnă că cu cât valoarea alfa este mai mare, cu atât este mai mare încrederea în test.
O eroare de tip I, sau o eroare de primul tip, apare atunci când ipoteza nulă este respinsă atunci când, în realitate, este adevărată. Cu alte cuvinte, o eroare de tip I este comparabilă cu o falsă pozitivă. Erorile de tip I sunt controlate prin definirea unui nivel adecvat de semnificație. Cele mai bune practici în testarea științifică a ipotezelor necesită selectarea unui nivel de semnificație înainte de începerea colectării datelor. Cel mai frecvent nivel de semnificație este 0,05 (sau 5%) ceea ce înseamnă că există o probabilitate de 5% ca testul să sufere o eroare de tip I respingând o adevărată ipoteză nulă. Acest nivel de semnificație se traduce invers la un nivel de încredere de 95%, ceea ce înseamnă că peste o serie de teste de ipoteză, 95% nu va duce la o eroare de tip I.