Acasă Finanțe personale Ce miniere de date - dummy

Ce miniere de date - dummy

Cuprins:

Video: 1990, ANUL 0 Alianța Civică iudeo-comunista, cea mai mare organizație neguvernamentală din România 2024

Video: 1990, ANUL 0 Alianța Civică iudeo-comunista, cea mai mare organizație neguvernamentală din România 2024
Anonim

Dacă vă gândiți la date ca materie primă și la informațiile obținute din date ca ceva valoros și relativ rafinat, procesul de extragere a informațiilor poate fi comparativ cu extragerea metalelor din minereu sau pietre prețioase din murdărie. Așa a rezultat termenul miniere de date .

Concentrându-se pe afacerea de extracție a datelor

Minerii de date nu doar se gândesc la date fără scop, sperând să găsească ceva interesant. Fiecare proiect de exploatare a datelor începe cu o problemă de afaceri specifică și cu un obiectiv care să se potrivească.

În calitate de miner de date, probabil că nu veți avea autoritatea de a lua decizii de afaceri finale, deci este important să vă aliniați munca la nevoile factorilor de decizie. Trebuie să înțelegeți problemele, nevoile și preferințele dvs. și să vă concentrați eforturile asupra furnizării de informații care să susțină decizii de afaceri bune.

cunoștințele dvs. de afaceri sunt foarte importante. Executivii nu vor sta alături de dvs. în timp ce lucrați, oferindu-vă feedback cu privire la relevanța descoperirilor dvs. față de preocupările lor. Trebuie să utilizați experiența și experiența proprie pentru a judeca acest lucru pentru dvs. în timp ce lucrați.

Ar fi minunat dacă minerii de date ar putea să-și petreacă toată ziua făcând descoperiri în continuă schimbare, construind modele valoroase și integrându-le în afacerile cotidiene. Dar este ca și cum aș spune că ar fi minunat dacă sportivii ar putea petrece turnee câștigătoare pe tot parcursul zilei. Este nevoie de multă pregătire pentru a construi acele momente de triumf. Deci, ca și atleții, minerii de date petrec mult timp pe pregătire.

Cunoașterea procesului de extragere a datelor

Un proces bun de lucru vă ajută să profitați cât mai mult de timpul, datele și toate celelalte resurse. În această carte, veți descoperi cel mai popular proces de extragere a datelor, CRISP-DM. Este un ciclu de descoperire și acțiune în șase faze, creat de un consorțiu de mineri de date din multe industrii și un standard deschis pe care oricine îl poate folosi.

Fazele procesului CRISP-DM sunt

Înțelegerea afacerii

  1. Înțelegerea datelor

  2. Pregătirea datelor

  3. Modelare

  4. Evaluare

  5. faza are o pondere egală în importanță pentru calitatea rezultatelor și valoare pentru afacere. Dar din punct de vedere al timpului necesar, pregătirea datelor domină. Pregătirea datelor necesită, în mod obișnuit, mai mult timp decât toate celelalte faze ale procesului de extragere a datelor combinate.

  6. Efectuarea de modele

Atunci când obiectivele sunt înțelese și datele sunt curățate și gata de utilizare, puteți să vă îndreptați atenția către construirea de modele predictive.Modelele fac ceea ce rapoartele nu pot; ele vă oferă informații care susțin acțiunea.

Un raport vă poate spune că vânzările au scăzut. Se pot rupe vânzările în funcție de regiune, produs și canal, astfel încât să știți unde au scăzut vânzările și dacă aceste scăderi au fost răspândite sau afectate numai în anumite zone. Dar ele nu vă dau nici un indiciu despre

vânzările care au scăzut sau ce acțiuni ar putea ajuta la relansarea afacerii.

Modelele vă ajută să înțelegeți factorii care influențează vânzările, acțiunile care tind să crească sau să scadă vânzările și strategiile și tacticile care vă mențin buna funcționare. E interesant, nu-i așa? Poate de aceea majoritatea mineriilor de date consideră că modelarea este partea distractivă a locului de muncă. Înțelegerea modelelor matematice Modelele matematice sunt esențiale pentru extracția de date, dar care sunt acestea? Ce fac, cum funcționează și cum sunt create?

Un model matematic este simplu și simplu, o ecuație sau un set de ecuații care descriu o relație între două sau mai multe lucruri. Astfel de ecuații sunt stenograma teoriilor despre funcționarea naturii și a societății. Teoria poate fi susținută de un corp substanțial de dovezi sau poate fi doar o presupunere sălbatică. Limba matematicii este aceeași în ambele cazuri.

Termeni cum ar fi

modelul predictiv, modelul statistic, sau

modelul liniar se referă la anumite tipuri de modele matematice, denumirile care reflectă destinația, forma sau metoda de derivare un model particular. Aceste trei exemple sunt doar câteva dintre numeroșii termeni. Atunci când un model este menționat într-o setare de afaceri, este cel mai probabil un model folosit pentru a face previziuni. Modelele sunt folosite pentru a prezice prețurile acțiunilor, vânzările de produse și ratele de șomaj, printre multe altele. Aceste predicții pot sau nu să fie corecte, dar pentru orice set de valori date (factori cunoscuți precum acestea sunt denumiți variabile independente

sau

intrări ) incluse în model, găsiți o predicție bine definită (numită și variabilă dependentă, ieșire, sau rezultat ). Modelele matematice sunt folosite și în alte scopuri în afaceri, cum ar fi descrierea mecanismelor de lucru care conduc un anumit proces. În procesul de extragere a datelor, creați modele prin găsirea tiparelor în date utilizând învățarea în mașină sau prin metode statistice. Minerii de date nu urmăresc aceeași abordare riguroasă pe care o fac statisticienii clasici, dar toate modelele sunt derivate din date reale și tehnici de modelare matematică consecventă. Toate modelele de date miniere sunt susținute de un corp de dovezi. De ce să folosim modele matematice? Nu s-ar putea descrie aceleași relații cu ajutorul cuvintelor? Acest lucru este posibil, totuși veți găsi anumite avantaje pentru utilizarea ecuațiilor. Acestea includ Convenabilitate:

În comparație cu descrierile echivalente scrise în propoziții, ecuațiile sunt scurte. Simbolismul matematic a evoluat în mod specific pentru a reprezenta relațiile matematice; limbi precum engleza nu au.

Claritate:

  • Ecuațiile transmit idei succint și sunt lipsite de ambiguitate.Ele nu sunt supuse unor interpretări diferite bazate pe cultură, iar simbolismul matematicii este un fel de limbaj comun utilizat pe scară largă pe tot globul. Consistența:

  • Deoarece reprezentările matematice nu sunt ambigue, implicațiile unei anumite situații sunt clar definite de un model matematic. Punerea informațiilor în acțiune

  • Un model oferă valoare numai atunci când îl folosiți în afacere. Predicțiile modelului ar putea sprijini luarea deciziilor într-o varietate de moduri. S-ar putea să includeți predicții într-un raport sau într-o prezentare care să fie utilizată la luarea unei decizii specifice.

Integrați modelul într-un sistem operațional (cum ar fi un sistem de servicii pentru clienți) pentru a oferi previziuni în timp real pentru utilizarea de zi cu zi. (De exemplu, ați putea semnala cererile de asigurare pentru plata imediată, negarea imediată sau investigația ulterioară.)

Utilizați modelul pentru previziuni lot. (De exemplu, puteți înscrie lista clienților interni pentru a decide care clienți ar trebui să primească o anumită ofertă.)

Ce miniere de date - dummy

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...