Acasă Finanțe personale 9 Legi ale Data Mining - dummies

9 Legi ale Data Mining - dummies

Cuprins:

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Anonim

Fiecare profesie are principiile călăuzitoare, ideile care oferă structură și îndrumare în munca de zi cu zi. Exploatarea datelor nu este o excepție. Următoarele sunt nouă idei fundamentale care vă ghidează pe măsură ce vă duceți la muncă și deveniți un miner de date. Acestea sunt cele 9 legi ale mineritului de date, așa cum au fost declarate inițial de minerul de date de pionierat Thomas Khabaza.

Prima lege: Obiectivele de afaceri

Iată prima Lege a Data Mining sau "Business Goals Law": Obiectivele de afaceri sunt originea oricărei soluții de extragere a datelor.

Examinați datele pentru a găsi informații care vă ajută să derulați mai bine afacerea. Nu ar trebui aceasta să fie mantra analizei tuturor datelor de afaceri? Desigur, ar trebui! Cu toate acestea, minerii de date novici se concentrează adesea pe tehnologie și pe alte detalii, care ar putea fi interesante, dar care nu sunt aliniate nevoilor și obiectivelor factorilor de decizie executivi.

Trebuie să vă dezvoltați un obișnuit de identificare a scopurilor de afaceri înainte de a face orice altceva și să vă concentrați asupra acestor obiective la fiecare pas al procesului de extragere a datelor. Este semnificativ faptul că această lege are prioritate. Toată lumea ar trebui să înțeleagă că exploatarea datelor este un proces cu un scop.

Legea a 2-a: cunoștințe despre afaceri

Iată Legea 2 a Data Mining sau "Legea cunoașterii afacerilor": Cunoștințele de afaceri sunt esențiale pentru fiecare etapă a procesului de extragere a datelor.

Exploatarea datelor dă putere oamenilor - oamenilor de afaceri - care își folosesc cunoștințele de afaceri, experiența și înțelegerea, împreună cu metodele de extragere a datelor, pentru a găsi sens în date.

Nu trebuie să fii un statistician fantezist care să facă mină de date, dar trebuie să știi ceva despre ce semnifică datele și cum funcționează afacerea. Numai atunci când înțelegeți datele și problema pe care trebuie să o rezolvați, procesele de extragere a datelor vă pot ajuta să descoperiți informații utile și să le folosiți.

A treia lege: Pregătirea datelor

Iată cea de-a treia lege a minelor de date sau "Legea de pregătire a datelor": Pregătirea datelor reprezintă mai mult de jumătate din fiecare proces de extragere a datelor.

Statisticienii tradiționali au adesea posibilitatea de a colecta date noi pentru a aborda întrebări specifice de cercetare. Aceștia pot utiliza procese riguroase pentru a planifica experimente, a elabora chestionare de cercetare sau a colecta în alt mod date de înaltă calitate care sunt bine direcționate către obiective specifice de cercetare. Cu toate acestea, ei încă mai petrec mult timp de curățare și de pregătire a datelor pentru analiză.

Minerii de date, pe de altă parte, trebuie să lucreze aproape întotdeauna cu orice date disponibile. Ei folosesc înregistrările comerciale existente, datele publice sau datele pe care le pot cumpăra.Există șanse, toate datele să fi fost colectate pentru alt scop decât extragerea de date și fără un plan riguros sau un proces atent de colectare a datelor. Deci minerii de date petrec mult timp pe pregătirea datelor.

Legea a 4-a: Modelul drept

Iată cea de-a patra lege a minelor de date sau "NFL-DM": Modelul potrivit pentru o anumită aplicație poate fi descoperit numai prin experiment.

Această lege este, de asemenea, cunoscută prin stenograma NFL-DM, ceea ce înseamnă că nu există niciun dejun gratuit pentru minerul de date.

În primul rând, care este modelul? Este o ecuație care reprezintă un model observat în date. Cel puțin, aceasta reprezintă modelul într-un mod dur. Modelele matematice ale lucrurilor reale nu sunt niciodată perfecte! Acesta este un fapt al vieții, și este la fel de adevărat pentru fizicienii nucleari ca și minerii de date.

În procesul de extragere a datelor, modelele sunt selectate prin încercări și erori. Veți experimenta diferite tipuri de modele.

Legea a 5-a: Model

Iată cea de-a 5-a lege a minelor de date: Există întotdeauna modele.

Ca miner de date, veți explora datele în căutarea unor modele utile. Cu alte cuvinte, veți căuta relații semnificative între variabilele din date. Înțelegerea acestor relații oferă o mai bună înțelegere a afacerii și previziuni mai bune asupra a ceea ce se va întâmpla în viitor. Cel mai important, înțelegerea tiparelor în date vă permite să influențați ceea ce se va întâmpla în viitor.

Întotdeauna găsiți modele. Datele au întotdeauna ceva de spus. Uneori, aceasta confirmă faptul că ceea ce ați făcut este corect. Poate că nu pare interesant, dar cel puțin vă spune că ați fost pe drumul cel bun. În alte zile, datele vă pot spune că practicile dvs. de afaceri curente nu funcționează. Este interesant și, deși nu este plăcut pe termen scurt, cunoașterea adevărului este un pas important spre îmbunătățire.

Legea 6: Amplificarea

Iată Legea 6 a Data Mining sau "Insight Law": Explorarea datelor amplifică percepția în domeniul afacerilor.

Metodele de extragere a datelor vă permit să înțelegeți mai bine afacerea dvs. decât ați fi putut face fără ele. Metodele de extragere a datelor vă ajută să vă doriți o lupă sau un microscop, permițând descoperirea unor efecte care ar fi dificil sau imposibil de detectat prin raportarea obișnuită.

Explorarea datelor nu este instantanee.

Descoperirea și învățarea prin extragerea datelor este un proces interactiv. Veți face descoperiri, veți afla câte ceva din fiecare dintre ele și veți folosi ceea ce ați descoperit că veți lua măsuri. Rezultatele fiecărei acțiuni pe care o încercați vor produce mai multe date, iar datele vă permit să înțelegeți ceva mai mult. Este un ciclu de descoperire, iar ciclul continuă atât timp cât continuați să explorați și să experimentați.

Legea a 7-a: Prognoza

Iată cea de-a 7-a Lege a Data Mining sau "Prediction Law": Predicția sporește informația locală prin generalizare.

Explorarea datelor vă ajută să utilizați ceea ce știți pentru a face previziuni (sau estimări) mai bune despre lucruri pe care nu le cunoașteți. Explorarea datelor folosește metode de date și modelare pentru a înlocui așteptările dvs. informale cu estimări bazate pe date, coerente și mai precise.

Legea a 8-a: Valoarea

Iată cea de-a opta lege a "Data Mining" sau "Value Law": Valoarea rezultatelor minelor de date nu este determinată de precizia sau stabilitatea modelelor predictive.

Minerii de date nu se amestecă peste teorie. Ca miner de date, este posibil să nu știți nici măcar teoria din spatele modelelor statistice pe care le utilizați. Poate că este la fel de bine, pentru că în procesul de exploatare a datelor veți folosi aceste modele în moduri care nu se aliniază neapărat cu teoria din spatele lor.

Veți căuta modele care produc previziuni corecte (și veți folosi mai degrabă teoria, decât teoria statistică, pentru a judeca acest lucru). Dar este posibil să fiți mai preocupat de alte probleme, cum ar fi dacă modelul are sens în afaceri, vă luminează despre factori predictivi neașteptate sau este practic să vă utilizați la locul de muncă.

A 9-a lege: Schimbare

Iată noua lege a minelor de date sau "Legea schimbării": Toate modelele pot fi modificate.

Lumea se schimbă mereu. Modelul care vă oferă astăzi minunate predicții poate fi inutil mâine. Acesta este un fapt de viață pentru toți analiștii de date, nu doar minerii de date.

9 Legi ale Data Mining - dummies

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...