Acasă Finanțe personale Date Mining - dummies

Date Mining - dummies

Cuprins:

Video: Persistence Date Mining: Memphis Demo Day 2017 2024

Video: Persistence Date Mining: Memphis Demo Day 2017 2024
Anonim

, în comparație cu interogarea, raportarea sau chiar OLAP, este că puteți obține informații fără a trebui să adresați întrebări specifice.

Explorarea datelor servește două roluri principale în misiunea dvs. de business intelligence:

  • Rolul "Spune-mi ce s-ar putea întâmpla": Primul rol al minelor de date este predictiv, în care spui, în principiu, s-ar putea întâmpla. "Folosind cunoștințele ascunse blocate în depozitul de date, probabilitățile și probabilitatea unor tendințe și apariții viitoare sunt împrăștiate și prezentate.

  • Rolul "Spune-mi ceva interesant": În plus față de posibilele evenimente și evenimente viitoare, exploatarea datelor încearcă, de asemenea, să scoată informații interesante pe care ar trebui să le cunoașteți, o relație neobișnuită între vânzarea a două produse diferite și modul în care această relație variază în funcție de plasarea în magazinele dvs. cu amănuntul.

    Deși multe dintre aceste tidbits interesante sunt susceptibile de a exista, ce întrebări ați întreba dacă utilizați un instrument de interogare sau OLAP și cum ați interpreta rezultatele? Exploatarea datelor vă ajută în această sarcină dificilă de a afla ce întrebări trebuie să întrebați, făcând o mare parte din lucrarea pentru voi.

Exploatarea datelor în misiuni specifice de afaceri

Explorarea datelor este potrivită în mod special pentru aceste tipuri specifice de misiuni comerciale:

  • Detectarea fraudei

  • Determinarea eficacității programului de marketing

  • o bază de clienți mare sau populația generală, ar trebui să vizezi ca parte a unui program de marketing

  • Gestionarea ciclului de viață a clienților, inclusiv a misiunii de reținere a clienților

    ->
  • Efectuarea de modelare avansată a proceselor de afaceri și a scenariilor care ar putea fi

Gândiți-vă la ceea ce se află în spatele fiecărei misiuni de afaceri din lista precedentă:

  • O cantitate mare de date

  • numărul de combinații de date diferite

  • Analiza setului de rezultate intensive, implicând de obicei algoritmi complexe și tehnici statistice avansate

Acum, gândiți-vă la ceea ce ar trebui să faceți dacă utilizați un instrument de raportare sau OLAP pentru a îndeplini aceste misiuni. Considerați că este practic imposibil să efectuați toate misiunile anterioare dacă ar trebui să puneți o întrebare și să obțineți un rezultat, să întrebați o altă întrebare și să obțineți un alt rezultat și apoi să repetați acești pași.

Exploatarea de date și inteligența artificială

Dacă ați fost în domeniul tehnologiei informației (IT) timp de cel puțin un deceniu, unii dintre termenii precedenți s-ar putea suna cam vag familiar.Deblocarea cunoștințelor ascunse? Funcționalitate predictivă? Așteaptă un minut - asta e inteligența artificială!

De la primele zile de calcul comercial, a existat un interes extraordinar în dezvoltarea "mașinilor de gândire" care pot procesa cantități mari de date și pot lua decizii pe baza acestei analize.

Interesul în inteligența artificială (AI) a lovit zenitul său la mijlocul anilor 1980. La acel moment, furnizorii de baze de date au lucrat la producerea sistemelor de management al bazelor de cunoștințe (KBMS); alți furnizori au ieșit împreună cu cochilii de sistem expert, sau cadre de dezvoltare a aplicațiilor bazate pe AI care foloseau tehnici cum ar fi legarea înainte și înlănțuirea înapoi pentru a sfătui utilizatorii cu privire la decizii; și rețelele neuronale au fost poziționate ca fiind următoarea dezvoltare AI mare.

Interesul pentru AI a scăzut la începutul anilor 1990, când așteptările au depășit capacitățile disponibile și alte fenomene, cum ar fi migrarea clienților / serverului și, bineînțeles, depozitarea datelor, au avut loc în centrul atenției.

Acum, AI se întoarce!

Tehnica cel mai înalt profil AI utilizată în exploatarea datelor este rețelele neuronale. Plasele neuronale au fost inițial concepute ca un model de procesare care să imite felul în care creierul uman rezolvă problemele, folosind neuroni și procesarea extrem de paralelă pentru a face rezolvarea de modele.

Aplicarea algoritmilor rețelei neuronale în zonele de inteligență a afacerii pe care le gestionează datele miniere (din nou, predictive și misiuni "spune-mi ceva interesant") pare a fi un meci natural.

Deși jocul de date mining / rețea neuronală merită cu siguranță să fie verificat, ar trebui să o faceți cu atenție. Puteți găsi o mulțime de tehnologii interesante și interesante care, în mâinile celor care nu înțeleg algoritmii, vor eșua probabil.

Cu toate acestea, cu o cunoaștere și o educație adecvată, puteți face un angajament pe scară largă de a aduce acest tip de procesare în cadrul dvs. de inteligență a afacerii dvs. ca o pereche de analize tehnice pentru analiza de afaceri concentrată pe OLAP.

Explorarea datelor și statisticile

Suprafața mai matură a activităților de extragere a datelor este aplicarea unor tehnici statistice avansate împotriva volumelor mari de date din depozitul de date. Instrumentele diferite utilizează diferite tipuri de tehnici statistice, adaptate la zonele pe care încearcă să le abordeze.

Fără o experiență statistică, s-ar putea să găsiți o mare parte din mintea de date confuză. Trebuie să faceți o mulțime de lucruri pentru a instrui algoritmii și pentru a construi regulile pentru a vă asigura rezultate adecvate cu seturi de date mai mari. Cu toate acestea, presupunând că sunteți confortabil cu acest concept sau dacă aveți un coleg care vă poate ajuta, iată câțiva dintre algoritmii cu mai mare influență:

  • Algoritmi de clasificare: Preziceți una sau mai multe variabile discrete, bazate pe cealaltă atribute în setul de date. Folosind algoritmi de clasificare, instrumentul de extragere a datelor poate analiza cantități mari de date și apoi vă informează că, de exemplu, "Clienții care sunt reținuți prin cel puțin două generații de achiziții de produse tind să aibă aceste caracteristici: Ei au un venit de cel puțin 75 000 de dolari, și își dețin propriile case."

  • Algoritmi de regresie: Preziceți una sau mai multe variabile continue, cum ar fi profitul sau pierderea, pe baza altor atribute din setul de date. Algoritmii de regresie sunt conduse prin intermediul informațiilor istorice prezentate în instrumentul de extragere a datelor "în timp", mai bine cunoscut sub numele de informații despre seria de timp .

  • Algoritmi de segmentare: Împărțiți datele în grupuri sau grupuri de elemente care au proprietăți similare.

  • Algoritmi de asociere: Găsiți corelații între diferite atribute dintr-un set de date. Aplicația cea mai comună a acestui tip de algoritm creează reguli de asociere, pe care le puteți utiliza într-o analiză a coșului de piață. Rețineți că, de exemplu, în cazul în care un client achiziționează un anumit pachet software, acesta are o șansă de 65% de a achiziționa cel puțin două pachete de produse suplimentare în interval de două săptămâni.

  • Algoritmi de analiză a secvenței: Rezumați secvențele sau episoadele frecvente din date, cum ar fi un flux al căii web.

Există multe metode. Desprindeți vechea carte de statistici și începeți să citiți.

Date Mining - dummies

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...