Cuprins:
- Semnificativ nu înseamnă întotdeauna important
- Regresia nu este întotdeauna liniară
- Extrapolând dincolo de o probă scatterplot este o idee proastă
- Examinați variabilitatea în jurul unei linii de regresie
- O probă poate fi prea mare
- Consumatori: Cunoașteți axele
- Graficarea unei variabile categorice ca și cum ar fi o variabilă cantitativă este doar greșită
- Ori de câte ori este cazul, includeți variabilitatea graficului
- Aveți grijă când asociați conceptele de manuale statistice cu Excel
Video: 151 Tips and Tricks for PUBG Mobile! 2024
Lumea statisticii este plină de capcane, dar este și plină de oportunități. Indiferent dacă sunteți utilizator de statistici sau cineva care trebuie să le interpreteze, este posibil să cădeți în capcane. Este, de asemenea, posibil să te plimbi în jurul lor. Iată câteva sfaturi și capcane din domeniile testării ipotezelor, regresiei, corelării și graficului.
Semnificativ nu înseamnă întotdeauna important
Semnificația este, în multe privințe, un termen slab ales. Atunci când un test statistic generează un rezultat semnificativ și decizia este respingerea H 0 , acest lucru nu garantează faptul că studiul din spatele datelor este unul important. Statisticile pot ajuta doar la luarea deciziilor cu privire la numere și la inferențe legate de procesele care le-au produs. Nu pot face ca aceste procese să fie importante sau să se distrugă. Importanța este ceva pe care trebuie să-l judecați pentru tine - și nici un test statistic nu poate face asta pentru tine.
Regresia nu este întotdeauna liniară
Atunci când încercați să potriviți un model de regresie unui scatterplot, ispita este să utilizați imediat o linie. Acesta este modelul cel mai bine înțelegat de regresie, iar atunci când îl înțepați, pantele și interceptele nu sunt atât de deranjante.
Dar regresia liniară nu este singurul tip de regresie. Este posibil să se potrivească o curbă printr-un scatterplot. Nu vă lăsați păcăliți: conceptele statistice din spatele regresiei curbilinere sunt mai greu de înțeles decât conceptele din spatele regresiei liniare.
Totuși, merită să luăm timp pentru a stăpâni aceste concepte. Uneori, o curbă este mult mai bună decât o linie.
Extrapolând dincolo de o probă scatterplot este o idee proastă
Fie că lucrați cu regresie liniară sau regresie curbilinie, rețineți că este inadecvat să generalizați dincolo de limitele scatterplot.
Să presupunem că ați stabilit o relație predictivă solidă între un test de aptitudini matematice și performanță în cursurile de matematică și scatterplot-ul dvs. acoperă doar o gamă restrânsă de aptitudini matematice. Nu aveți cum să știți dacă relația se află în afara acestui interval. Predicțiile din afara acestui interval nu sunt valide.
Cel mai bun pariu este să extindeți scatterplot-ul prin testarea mai multor persoane. S-ar putea să afli că relația originală spune doar o parte din poveste.
Examinați variabilitatea în jurul unei linii de regresie
Analiza atentă a reziduurilor (diferențele dintre valorile observate și cele prezise) vă poate spune foarte mult despre cât de bine se potrivește linia cu datele. O presupunere fundamentală este că variabilitatea în jurul unei linii de regresie este aceeași în sus și în jos.Dacă nu, modelul ar putea să nu fie la fel de predictiv pe cât credeți. Dacă variabilitatea este sistematică (o variabilitate mai mare la un capăt decât la cealaltă), regresia curbilinie ar putea fi mai potrivită decât liniară. Eroarea standard a estimării nu va fi întotdeauna indicatorul.
O probă poate fi prea mare
Credeți-vă sau nu, acest lucru se întâmplă uneori cu coeficienți de corelație. Un eșantion foarte mare poate face un coeficient de corelare mic semnificativ din punct de vedere statistic.
Dar ce înseamnă cu adevărat acest coeficient de corelație? Coeficientul de determinare -r 2 - este just. 038, ceea ce înseamnă că SS Regresia este mai mică de 4% din SS Total . Aceasta este o asociere foarte mică.
Linia de fund: Când privim la un coeficient de corelație, trebuie să fim conștienți de mărimea eșantionului. Dacă este destul de mare, poate face ca o asociație trivială să se dovedească semnificativă din punct de vedere statistic. (Hmmm … semnificație - acolo este din nou!)
Consumatori: Cunoașteți axele
Când vă uitați la un grafic, asigurați-vă că știți ce se întâmplă pe fiecare axă. Asigurați-vă că înțelegeți unitățile de măsură. Înțelegeți variabila independentă? Înțelegeți variabila dependentă? Puteți descrie fiecare în cuvintele voastre? Dacă răspunsul la oricare dintre aceste întrebări este "Nu", nu înțelegeți graficul pe care îl căutați.
Atunci când priviți la un grafic într-un anunț TV, fiți foarte atent dacă dispare prea repede, înainte de a vedea ce se află pe axe. Agentul de publicitate încearcă să creeze o impresie falsă despre o relație falsă în interiorul graficului. Relația grafitată ar putea fi la fel de valabilă ca și cea din alte articole de publicitate TV - dovada științifică prin desen animat: Perioadele minuscule de curățare animate pentru curățarea dinților de desene animate ar putea să nu garanteze neapărat dinții albi pentru dvs. dacă cumpărați produsul.
->Graficarea unei variabile categorice ca și cum ar fi o variabilă cantitativă este doar greșită
Deci ești aproape gata să concurezi în World Series of Rock-Paper-Scissors. În pregătirea pentru acest turneu internațional, ați înregistrat toate meciurile din ultimii zece ani, indicând procentul de ori câștigat atunci când ați jucat fiecare rol.
Pentru a rezuma toate rezultatele, utilizați capabilitățile grafice ale Excel pentru a crea un grafic.
Atât de mulți oameni creează astfel de grafice - oameni care ar trebui să știe mai bine. Linia din grafic implică continuitate de la un punct la altul. Cu aceste date, desigur, acest lucru este imposibil. Ce e între rock și hârtie? De ce sunt separate unitățile egale? De ce sunt cele trei categorii în această ordine?
Pur și simplu, un grafic liniar nu este graficul corect atunci când cel puțin una dintre variabilele dvs. este un set de categorii. În schimb, creați un grafic de coloană. Tot aici funcționează și o diagrama plăcintă, deoarece datele sunt procente și aveți doar câteva felii.
Ori de câte ori este cazul, includeți variabilitatea graficului
Atunci când punctele din graficul dvs. reprezintă mijloace, asigurați-vă că graficul include eroarea standard a fiecărei medii.Acest lucru oferă spectatorilor o idee despre variabilitatea datelor - care este un aspect important al datelor.
Mijloacele de la sine nu îți spun întotdeauna întreaga poveste. Utilizați fiecare ocazie pentru a examina variațiile și deviațiile standard. S-ar putea găsi niște nuggeturi ascunse. Variația sistematică - valorile ridicate ale varianței asociate cu mijloacele mari, de exemplu - ar putea fi o idee despre o relație pe care nu ați mai văzut-o înainte.
Aveți grijă când asociați conceptele de manuale statistice cu Excel
Dacă sunteți serios în ceea ce privește lucrul statistic, probabil că veți avea ocazia să examinați un text de statistici sau două. Rețineți că simbolurile din anumite zone ale statisticilor nu sunt standard.
Conectarea conceptelor manual la funcțiile statistice ale Excel poate fi o provocare din cauza textelor și din cauza Excel. Mesajele din casetele de dialog și din fișierele Ajutor ar putea să conțină alte simboluri decât cele pe care le-ați citit sau ar putea folosi aceleași simboluri, dar într-un mod diferit. Această discrepanță vă poate determina să introduceți o intrare incorectă într-un parametru într-o casetă de dialog, rezultând o eroare care este greu de urmărit.