Video: Data Visualization and D3 by David Chouinard 2024
În analizarea datelor pentru infografică dvs., ar trebui să fie conștienți de faptul că unele puncte de date - cunoscut sub numele de valorile extreme - pune atât de mult în afara normei la apelați la ei înșiși. În cele mai grave cazuri, ele pot chiar denatura datele și pot crea o imagine înșelătoare a subiectului. Trebuie să recunoașteți atunci când aveți un excedent și apoi să decideți ce să faceți.
Acest tabel conține un exemplu simplu pentru a demonstra această idee. Cele două seturi de date reprezintă clasele studenților, timp de opt săptămâni, pe două examene săptămânale; numerele sunt procentul corect pentru examen. Setul de date din stânga (primul examen) nu conține un extractor, dar face setul de date din partea dreaptă (al doilea examen). Singurul extras este arătat cu caractere aldine.
Week | Note (fara outlier) | Note (un outlier) |
---|---|---|
1 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
Media > 87% | 83% |
|
Ce face un jurnalist de date într-un astfel de caz? Iată câteva opțiuni:
Aruncați extrapolarea.
-
Dacă utilizați doar media din grafic și sunteți preocupat de faptul că este înșelătoare, eliminați-l ca pe o aberație și apoi calculați media fără săptămâna respectivă, după cum se arată în figură. Dacă mergeți cu această opțiune, asigurați-vă că adăugați o notă de subsol care explică totul: în acest caz, ștergerea unui punct de date. Fiți întotdeauna cât mai transparent posibil.
Afișați datele așa cum este.
Indiferent dacă utilizați doar media din grafic sau compilați toate datele dintr-o diagramă, puteți întotdeauna să prezentați datele exact așa cum a venit la dvs., după cum se arată în figura următoare.
-
În acest caz, ar trebui să adăugați o notă de subsol prin care să strigeți offlierul, astfel încât cititorul să fie pe deplin conștient de acesta. Construiți o linie de potrivire optimă. "
Această opțiune se aplică numai dacă intenționați să creați o diagramă care să afișeze toate datele. O linie de potrivire optimă - numită și o regresie liniară
-
- reprezintă media vizuală a datelor dvs.: literalmente linia care reprezintă punctele de date împrăștiate cel mai bine.