Video: 97% posedat - un documentar despre adevărul economic 2024
O statistică se consideră a fi robustă dacă nu este puternic influențată de prezența unor valori excepționale. De exemplu, media nu este robustă, deoarece poate fi puternic afectată de prezența unor valori excepționale. Pe de altă parte, valoarea mediană este robustă - nu este afectată de valori extreme.
De exemplu, să presupunem că următoarele date reprezintă un eșantion al veniturilor gospodăriilor într-un oraș mic (măsurat în mii de dolari pe an):
32, 47, 20, 25, 56
Calculați media eșantionului ca sumă a celor cinci observații împărțite la cinci:
Media eșantionului este de 36 000 $ pe an. Majoritatea gospodăriilor din eșantion sunt foarte apropiate de această valoare.
Să presupunem că eșantionul constă în următoarele valori:
Odată cu deviația, media eșantionului este acum:
Această măsură nu este reprezentativă pentru majoritatea gospodăriilor din oraș. Astfel, utilitatea mediei este compromisă în prezența unor valori extreme.
Calculați mediana eșantionului sortând datele de la cea mai mică la cea mai mare și apoi găsiți valoarea care împarte eșantionul la jumătate. Cu alte cuvinte, jumătate din observații sunt sub mediană, iar jumătate sunt deasupra.
Primul eșantion:32, 47, 20, 25, 56
Probele sortate:
20, 25, 32, 47, 56
jumătate din observațiile rămase sunt sub 32 și jumătate sunt deasupra.
Cel de-al doilea eșantion:
32, 47, 20, 25, 376
În ciuda prezenței extravetei de 376, media este încă 32. Nu a fost afectată de depășire. Acest lucru arată că spre deosebire de media, valoarea mediană este
robustă
în raport cu valorile negative.
Alte exemple de statistici robuste includ deviația mediană, absolută și intervalul interquartilat.