În statistici, termenul robust sau robustete se referă la puterea unui model statistic, teste și proceduri în funcție de condițiile specifice ale analizei statistice pe care un studiu speră să o realizeze. Dat fiind faptul că aceste condiții ale unui studiu sunt îndeplinite, modelele pot fi verificate ca fiind adevărate prin utilizarea unor dovezi matematice.
Multe modele se bazează pe situații ideale care nu există atunci când lucrezi cu date din lumea reală și, ca urmare, modelul poate oferi rezultate corecte chiar dacă condițiile nu sunt îndeplinite exact.
Prin urmare, statistici solide sunt orice statistici care obțin performanțe bune atunci când datele sunt obținute dintr-o gamă largă de distribuții de probabilitate, care sunt în mare parte neafectate de valorile exterioare sau mici depărtări de la presupunerile modelului într-un set de date dat. Cu alte cuvinte, o statistică robustă este rezistentă la erorile rezultate.
O modalitate de a observa o procedură statistică robustă obișnuită, trebuie să nu privim mai mult decât procedurile t, care folosesc teste de ipoteză pentru a determina cele mai precise predicții statistice.
Pentru un exemplu de robustete, vom lua în considerare T-proceduri, care includ intervalul de încredere pentru o medie a populației cu deviație standard a populației necunoscute, precum și teste de ipoteză despre media populației.
Utilizarea T-procedurile presupun următoarele:
În practică cu exemple din viața reală, statisticienii au rareori o populație care este distribuită în mod normal, astfel încât întrebarea devine în schimb: „Cât de puternice sunt T-proceduri?“
În general, starea că avem un eșantion simplu aleatoriu este mai importantă decât condiția pe care am prelevat-o de la o populație normal distribuită; motivul pentru aceasta este că teorema limită centrală asigură o distribuție de eșantionare care este aproximativ normală - cu cât dimensiunea eșantionului este mai mare, cu atât mai aproape de distribuția eșantionului medie a eșantionului.
Atât de robustă pentru T-procedurile se bazează pe mărimea eșantionului și distribuția eșantionului nostru. Acestea includ:
În cele mai multe cazuri, robustetea a fost stabilită prin lucrări tehnice în statisticile matematice și, din fericire, nu este necesar să facem aceste calcule matematice avansate pentru a le folosi corect; trebuie doar să înțelegem care sunt orientările generale pentru robustetea metodei noastre statistice specifice.
Procedurile T funcționează ca statistici solide, deoarece obișnuiesc să obțină performanțe bune pentru aceste modele prin factorizarea dimensiunii eșantionului în baza aplicării procedurii.