Cuprins:
- Concentrându-se pe afacerea de extracție a datelor
- Ar fi minunat dacă minerii de date ar putea să-și petreacă toată ziua făcând descoperiri în continuă schimbare, construind modele valoroase și integrându-le în afacerile cotidiene. Dar este ca și cum aș spune că ar fi minunat dacă sportivii ar putea petrece turnee câștigătoare pe tot parcursul zilei. Este nevoie de multă pregătire pentru a construi acele momente de triumf. Deci, ca și atleții, minerii de date petrec mult timp pe pregătire.
- Un proces bun de lucru vă ajută să profitați cât mai mult de timpul, datele și toate celelalte resurse. În această carte, veți descoperi cel mai popular proces de extragere a datelor, CRISP-DM. Este un ciclu de descoperire și acțiune în șase faze, creat de un consorțiu de mineri de date din multe industrii și un standard deschis pe care oricine îl poate folosi.
- Un raport vă poate spune că vânzările au scăzut. Se pot rupe vânzările în funcție de regiune, produs și canal, astfel încât să știți unde au scăzut vânzările și dacă aceste scăderi au fost răspândite sau afectate numai în anumite zone. Dar ele nu vă dau nici un indiciu despre
- Termeni cum ar fi
- Integrați modelul într-un sistem operațional (cum ar fi un sistem de servicii pentru clienți) pentru a oferi previziuni în timp real pentru utilizarea de zi cu zi. (De exemplu, ați putea semnala cererile de asigurare pentru plata imediată, negarea imediată sau investigația ulterioară.)
Video: 1990, ANUL 0 Alianța Civică iudeo-comunista, cea mai mare organizație neguvernamentală din România 2024
Dacă vă gândiți la date ca materie primă și la informațiile obținute din date ca ceva valoros și relativ rafinat, procesul de extragere a informațiilor poate fi comparativ cu extragerea metalelor din minereu sau pietre prețioase din murdărie. Așa a rezultat termenul miniere de date .
Concentrându-se pe afacerea de extracție a datelor
Minerii de date nu doar se gândesc la date fără scop, sperând să găsească ceva interesant. Fiecare proiect de exploatare a datelor începe cu o problemă de afaceri specifică și cu un obiectiv care să se potrivească.
În calitate de miner de date, probabil că nu veți avea autoritatea de a lua decizii de afaceri finale, deci este important să vă aliniați munca la nevoile factorilor de decizie. Trebuie să înțelegeți problemele, nevoile și preferințele dvs. și să vă concentrați eforturile asupra furnizării de informații care să susțină decizii de afaceri bune.
cunoștințele dvs. de afaceri sunt foarte importante. Executivii nu vor sta alături de dvs. în timp ce lucrați, oferindu-vă feedback cu privire la relevanța descoperirilor dvs. față de preocupările lor. Trebuie să utilizați experiența și experiența proprie pentru a judeca acest lucru pentru dvs. în timp ce lucrați.
Ar fi minunat dacă minerii de date ar putea să-și petreacă toată ziua făcând descoperiri în continuă schimbare, construind modele valoroase și integrându-le în afacerile cotidiene. Dar este ca și cum aș spune că ar fi minunat dacă sportivii ar putea petrece turnee câștigătoare pe tot parcursul zilei. Este nevoie de multă pregătire pentru a construi acele momente de triumf. Deci, ca și atleții, minerii de date petrec mult timp pe pregătire.
Un proces bun de lucru vă ajută să profitați cât mai mult de timpul, datele și toate celelalte resurse. În această carte, veți descoperi cel mai popular proces de extragere a datelor, CRISP-DM. Este un ciclu de descoperire și acțiune în șase faze, creat de un consorțiu de mineri de date din multe industrii și un standard deschis pe care oricine îl poate folosi.
Fazele procesului CRISP-DM sunt
Înțelegerea afacerii
-
Înțelegerea datelor
-
Pregătirea datelor
-
Modelare
-
Evaluare
-
faza are o pondere egală în importanță pentru calitatea rezultatelor și valoare pentru afacere. Dar din punct de vedere al timpului necesar, pregătirea datelor domină. Pregătirea datelor necesită, în mod obișnuit, mai mult timp decât toate celelalte faze ale procesului de extragere a datelor combinate.
-
Efectuarea de modele
Atunci când obiectivele sunt înțelese și datele sunt curățate și gata de utilizare, puteți să vă îndreptați atenția către construirea de modele predictive.Modelele fac ceea ce rapoartele nu pot; ele vă oferă informații care susțin acțiunea.
Un raport vă poate spune că vânzările au scăzut. Se pot rupe vânzările în funcție de regiune, produs și canal, astfel încât să știți unde au scăzut vânzările și dacă aceste scăderi au fost răspândite sau afectate numai în anumite zone. Dar ele nu vă dau nici un indiciu despre
vânzările care au scăzut sau ce acțiuni ar putea ajuta la relansarea afacerii.
Modelele vă ajută să înțelegeți factorii care influențează vânzările, acțiunile care tind să crească sau să scadă vânzările și strategiile și tacticile care vă mențin buna funcționare. E interesant, nu-i așa? Poate de aceea majoritatea mineriilor de date consideră că modelarea este partea distractivă a locului de muncă. Înțelegerea modelelor matematice Modelele matematice sunt esențiale pentru extracția de date, dar care sunt acestea? Ce fac, cum funcționează și cum sunt create?
Un model matematic este simplu și simplu, o ecuație sau un set de ecuații care descriu o relație între două sau mai multe lucruri. Astfel de ecuații sunt stenograma teoriilor despre funcționarea naturii și a societății. Teoria poate fi susținută de un corp substanțial de dovezi sau poate fi doar o presupunere sălbatică. Limba matematicii este aceeași în ambele cazuri.
Termeni cum ar fi
modelul predictiv, modelul statistic, sau
modelul liniar se referă la anumite tipuri de modele matematice, denumirile care reflectă destinația, forma sau metoda de derivare un model particular. Aceste trei exemple sunt doar câteva dintre numeroșii termeni. Atunci când un model este menționat într-o setare de afaceri, este cel mai probabil un model folosit pentru a face previziuni. Modelele sunt folosite pentru a prezice prețurile acțiunilor, vânzările de produse și ratele de șomaj, printre multe altele. Aceste predicții pot sau nu să fie corecte, dar pentru orice set de valori date (factori cunoscuți precum acestea sunt denumiți variabile independente
sau
intrări ) incluse în model, găsiți o predicție bine definită (numită și variabilă dependentă, ieșire, sau rezultat ). Modelele matematice sunt folosite și în alte scopuri în afaceri, cum ar fi descrierea mecanismelor de lucru care conduc un anumit proces. În procesul de extragere a datelor, creați modele prin găsirea tiparelor în date utilizând învățarea în mașină sau prin metode statistice. Minerii de date nu urmăresc aceeași abordare riguroasă pe care o fac statisticienii clasici, dar toate modelele sunt derivate din date reale și tehnici de modelare matematică consecventă. Toate modelele de date miniere sunt susținute de un corp de dovezi. De ce să folosim modele matematice? Nu s-ar putea descrie aceleași relații cu ajutorul cuvintelor? Acest lucru este posibil, totuși veți găsi anumite avantaje pentru utilizarea ecuațiilor. Acestea includ Convenabilitate:
În comparație cu descrierile echivalente scrise în propoziții, ecuațiile sunt scurte. Simbolismul matematic a evoluat în mod specific pentru a reprezenta relațiile matematice; limbi precum engleza nu au.
Claritate:
-
Ecuațiile transmit idei succint și sunt lipsite de ambiguitate.Ele nu sunt supuse unor interpretări diferite bazate pe cultură, iar simbolismul matematicii este un fel de limbaj comun utilizat pe scară largă pe tot globul. Consistența:
-
Deoarece reprezentările matematice nu sunt ambigue, implicațiile unei anumite situații sunt clar definite de un model matematic. Punerea informațiilor în acțiune
-
Un model oferă valoare numai atunci când îl folosiți în afacere. Predicțiile modelului ar putea sprijini luarea deciziilor într-o varietate de moduri. S-ar putea să includeți predicții într-un raport sau într-o prezentare care să fie utilizată la luarea unei decizii specifice.
Integrați modelul într-un sistem operațional (cum ar fi un sistem de servicii pentru clienți) pentru a oferi previziuni în timp real pentru utilizarea de zi cu zi. (De exemplu, ați putea semnala cererile de asigurare pentru plata imediată, negarea imediată sau investigația ulterioară.)
Utilizați modelul pentru previziuni lot. (De exemplu, puteți înscrie lista clienților interni pentru a decide care clienți ar trebui să primească o anumită ofertă.)