Cuprins:
- Prima lege: Obiectivele de afaceri
- Legea a 2-a: cunoștințe despre afaceri
- A treia lege: Pregătirea datelor
- Legea a 4-a: Modelul drept
- Legea a 5-a: Model
- Legea 6: Amplificarea
- Legea a 7-a: Prognoza
- Legea a 8-a: Valoarea
- A 9-a lege: Schimbare
Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Fiecare profesie are principiile călăuzitoare, ideile care oferă structură și îndrumare în munca de zi cu zi. Exploatarea datelor nu este o excepție. Următoarele sunt nouă idei fundamentale care vă ghidează pe măsură ce vă duceți la muncă și deveniți un miner de date. Acestea sunt cele 9 legi ale mineritului de date, așa cum au fost declarate inițial de minerul de date de pionierat Thomas Khabaza.
Prima lege: Obiectivele de afaceri
Iată prima Lege a Data Mining sau "Business Goals Law": Obiectivele de afaceri sunt originea oricărei soluții de extragere a datelor.
Examinați datele pentru a găsi informații care vă ajută să derulați mai bine afacerea. Nu ar trebui aceasta să fie mantra analizei tuturor datelor de afaceri? Desigur, ar trebui! Cu toate acestea, minerii de date novici se concentrează adesea pe tehnologie și pe alte detalii, care ar putea fi interesante, dar care nu sunt aliniate nevoilor și obiectivelor factorilor de decizie executivi.
Trebuie să vă dezvoltați un obișnuit de identificare a scopurilor de afaceri înainte de a face orice altceva și să vă concentrați asupra acestor obiective la fiecare pas al procesului de extragere a datelor. Este semnificativ faptul că această lege are prioritate. Toată lumea ar trebui să înțeleagă că exploatarea datelor este un proces cu un scop.
Legea a 2-a: cunoștințe despre afaceri
Iată Legea 2 a Data Mining sau "Legea cunoașterii afacerilor": Cunoștințele de afaceri sunt esențiale pentru fiecare etapă a procesului de extragere a datelor.
Exploatarea datelor dă putere oamenilor - oamenilor de afaceri - care își folosesc cunoștințele de afaceri, experiența și înțelegerea, împreună cu metodele de extragere a datelor, pentru a găsi sens în date.
Nu trebuie să fii un statistician fantezist care să facă mină de date, dar trebuie să știi ceva despre ce semnifică datele și cum funcționează afacerea. Numai atunci când înțelegeți datele și problema pe care trebuie să o rezolvați, procesele de extragere a datelor vă pot ajuta să descoperiți informații utile și să le folosiți.
A treia lege: Pregătirea datelor
Iată cea de-a treia lege a minelor de date sau "Legea de pregătire a datelor": Pregătirea datelor reprezintă mai mult de jumătate din fiecare proces de extragere a datelor.
Statisticienii tradiționali au adesea posibilitatea de a colecta date noi pentru a aborda întrebări specifice de cercetare. Aceștia pot utiliza procese riguroase pentru a planifica experimente, a elabora chestionare de cercetare sau a colecta în alt mod date de înaltă calitate care sunt bine direcționate către obiective specifice de cercetare. Cu toate acestea, ei încă mai petrec mult timp de curățare și de pregătire a datelor pentru analiză.
Minerii de date, pe de altă parte, trebuie să lucreze aproape întotdeauna cu orice date disponibile. Ei folosesc înregistrările comerciale existente, datele publice sau datele pe care le pot cumpăra.Există șanse, toate datele să fi fost colectate pentru alt scop decât extragerea de date și fără un plan riguros sau un proces atent de colectare a datelor. Deci minerii de date petrec mult timp pe pregătirea datelor.
Legea a 4-a: Modelul drept
Iată cea de-a patra lege a minelor de date sau "NFL-DM": Modelul potrivit pentru o anumită aplicație poate fi descoperit numai prin experiment.
Această lege este, de asemenea, cunoscută prin stenograma NFL-DM, ceea ce înseamnă că nu există niciun dejun gratuit pentru minerul de date.
În primul rând, care este modelul? Este o ecuație care reprezintă un model observat în date. Cel puțin, aceasta reprezintă modelul într-un mod dur. Modelele matematice ale lucrurilor reale nu sunt niciodată perfecte! Acesta este un fapt al vieții, și este la fel de adevărat pentru fizicienii nucleari ca și minerii de date.
În procesul de extragere a datelor, modelele sunt selectate prin încercări și erori. Veți experimenta diferite tipuri de modele.
Legea a 5-a: Model
Iată cea de-a 5-a lege a minelor de date: Există întotdeauna modele.
Ca miner de date, veți explora datele în căutarea unor modele utile. Cu alte cuvinte, veți căuta relații semnificative între variabilele din date. Înțelegerea acestor relații oferă o mai bună înțelegere a afacerii și previziuni mai bune asupra a ceea ce se va întâmpla în viitor. Cel mai important, înțelegerea tiparelor în date vă permite să influențați ceea ce se va întâmpla în viitor.
Întotdeauna găsiți modele. Datele au întotdeauna ceva de spus. Uneori, aceasta confirmă faptul că ceea ce ați făcut este corect. Poate că nu pare interesant, dar cel puțin vă spune că ați fost pe drumul cel bun. În alte zile, datele vă pot spune că practicile dvs. de afaceri curente nu funcționează. Este interesant și, deși nu este plăcut pe termen scurt, cunoașterea adevărului este un pas important spre îmbunătățire.
Legea 6: Amplificarea
Iată Legea 6 a Data Mining sau "Insight Law": Explorarea datelor amplifică percepția în domeniul afacerilor.
Metodele de extragere a datelor vă permit să înțelegeți mai bine afacerea dvs. decât ați fi putut face fără ele. Metodele de extragere a datelor vă ajută să vă doriți o lupă sau un microscop, permițând descoperirea unor efecte care ar fi dificil sau imposibil de detectat prin raportarea obișnuită.
Explorarea datelor nu este instantanee.
Descoperirea și învățarea prin extragerea datelor este un proces interactiv. Veți face descoperiri, veți afla câte ceva din fiecare dintre ele și veți folosi ceea ce ați descoperit că veți lua măsuri. Rezultatele fiecărei acțiuni pe care o încercați vor produce mai multe date, iar datele vă permit să înțelegeți ceva mai mult. Este un ciclu de descoperire, iar ciclul continuă atât timp cât continuați să explorați și să experimentați.
Legea a 7-a: Prognoza
Iată cea de-a 7-a Lege a Data Mining sau "Prediction Law": Predicția sporește informația locală prin generalizare.
Explorarea datelor vă ajută să utilizați ceea ce știți pentru a face previziuni (sau estimări) mai bune despre lucruri pe care nu le cunoașteți. Explorarea datelor folosește metode de date și modelare pentru a înlocui așteptările dvs. informale cu estimări bazate pe date, coerente și mai precise.
Legea a 8-a: Valoarea
Iată cea de-a opta lege a "Data Mining" sau "Value Law": Valoarea rezultatelor minelor de date nu este determinată de precizia sau stabilitatea modelelor predictive.
Minerii de date nu se amestecă peste teorie. Ca miner de date, este posibil să nu știți nici măcar teoria din spatele modelelor statistice pe care le utilizați. Poate că este la fel de bine, pentru că în procesul de exploatare a datelor veți folosi aceste modele în moduri care nu se aliniază neapărat cu teoria din spatele lor.
Veți căuta modele care produc previziuni corecte (și veți folosi mai degrabă teoria, decât teoria statistică, pentru a judeca acest lucru). Dar este posibil să fiți mai preocupat de alte probleme, cum ar fi dacă modelul are sens în afaceri, vă luminează despre factori predictivi neașteptate sau este practic să vă utilizați la locul de muncă.
A 9-a lege: Schimbare
Iată noua lege a minelor de date sau "Legea schimbării": Toate modelele pot fi modificate.
Lumea se schimbă mereu. Modelul care vă oferă astăzi minunate predicții poate fi inutil mâine. Acesta este un fapt de viață pentru toți analiștii de date, nu doar minerii de date.