Acasă Finanțe personale 10 Greșeli comune de exploatare a datelor (pe care nu le veți face)

10 Greșeli comune de exploatare a datelor (pe care nu le veți face)

Video: ОТ АТЕИСТА К СВЯТОСТИ 2024

Video: ОТ АТЕИСТА К СВЯТОСТИ 2024
Anonim

Exploatarea de date se face prin încercări și erori, astfel încât, pentru minerii de date, greșelile sunt naturale. Greșelile pot fi valoroase, cu alte cuvinte, cel puțin în anumite condiții. Cu toate acestea, nu toate greșelile sunt create. Unele sunt evitate mai bine. Următoarea listă oferă zece astfel de greșeli. Dacă le citiți cu atenție și le angajați în memorie, ați putea evita câteva lovituri pe curba de învățare:

  • Scăderea verificărilor calității datelor: Majoritatea minerierilor de date cred că dezvoltarea modelelor predictive este mai distractivă decât revizuirea datelor pentru probleme de calitate. Dar dacă nu reușiți să detectați și să corectați problemele de calitate a datelor, ați putea ajunge la predicții fără valoare.

  • Lipsesc punctul: Ai descoperit ceva fascinant! Este frumos, dar dacă nu este relevant și pentru problema de afaceri pe care ați hotărât să o rezolvați, ea nu este deloc relevantă. Reveniți pe drumul cel bun.

  • Credeți că un model din date dovedește o relație cauză-efect: Examinați un set de date și observați că atunci când crește variabila A, variabila B crește și ea. Acest lucru se poate întâmpla deoarece variabila A influențează variabila B sau deoarece variabila B influențează variabila A. Pe de altă parte, este posibil ca ambele să fie influențate de o altă variabilă pe care nu ați luat-o în considerare. Sau ar putea fi o coincidență o singură dată. Cine poate spune?

  • Extinderea concluziilor prea mult: Nu presupuneți că relațiile pe care le observați în date vor apărea în circumstanțe diferite. Dacă datele dvs. au fost colectate într-un mediu rece, nu presupuneți că lucrurile vor funcționa la fel într-o setare caldă a fabricii.

  • Pariuri pe rezultate care nu au sens: Metodele de extragere a datelor sunt informale și nu sunt de obicei susținute de metode și teorii științifice, astfel încât rezultatele dvs. ar fi mai bine să aibă cel puțin un sens comercial. Dacă nu există explicații de bun simț pentru rezultatele pe care le prezentați, conducerea dvs. executivă probabil că nu o va lua în serios și nu ar trebui.

  • Îndrăgostiți de o anumită metodă de modelare: Nu există un singur model de tip mining de date care să se potrivească fiecărei situații.

  • Punerea unui model în producție fără testare adecvată: Nu pariați afacerea dvs. pe un model predictiv până când nu ați testat-o ​​cu date de așteptare și la scară mică în teren.

  • Ignorarea rezultatelor care nu vă plac: Dacă ignorați acum datele dvs., acesta va reveni într-o zi și va spune: "Ți-am spus așa. "

  • Folosirea minelor de date pentru a răspunde fiecărei necesități de analiză a datelor: Explorarea datelor are o valoare extraordinară, totuși unele aplicații încă necesită metode riguroase de colectare a datelor, analize statistice oficiale și metode științifice.

  • Presupunând că tehnicile tradiționale de analiză a datelor nu mai contează: Consultați glontul anterior.

10 Greșeli comune de exploatare a datelor (pe care nu le veți face)

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...