Cuprins:
- Exploatarea datelor în misiuni specifice de afaceri
- Exploatarea de date și inteligența artificială
- Explorarea datelor și statisticile
Video: Persistence Date Mining: Memphis Demo Day 2017 2024
, în comparație cu interogarea, raportarea sau chiar OLAP, este că puteți obține informații fără a trebui să adresați întrebări specifice.
Explorarea datelor servește două roluri principale în misiunea dvs. de business intelligence:
-
Rolul "Spune-mi ce s-ar putea întâmpla": Primul rol al minelor de date este predictiv, în care spui, în principiu, s-ar putea întâmpla. "Folosind cunoștințele ascunse blocate în depozitul de date, probabilitățile și probabilitatea unor tendințe și apariții viitoare sunt împrăștiate și prezentate.
-
Rolul "Spune-mi ceva interesant": În plus față de posibilele evenimente și evenimente viitoare, exploatarea datelor încearcă, de asemenea, să scoată informații interesante pe care ar trebui să le cunoașteți, o relație neobișnuită între vânzarea a două produse diferite și modul în care această relație variază în funcție de plasarea în magazinele dvs. cu amănuntul.
Deși multe dintre aceste tidbits interesante sunt susceptibile de a exista, ce întrebări ați întreba dacă utilizați un instrument de interogare sau OLAP și cum ați interpreta rezultatele? Exploatarea datelor vă ajută în această sarcină dificilă de a afla ce întrebări trebuie să întrebați, făcând o mare parte din lucrarea pentru voi.
Exploatarea datelor în misiuni specifice de afaceri
Explorarea datelor este potrivită în mod special pentru aceste tipuri specifice de misiuni comerciale:
-
Detectarea fraudei
-
Determinarea eficacității programului de marketing
-
o bază de clienți mare sau populația generală, ar trebui să vizezi ca parte a unui program de marketing
-
Gestionarea ciclului de viață a clienților, inclusiv a misiunii de reținere a clienților
-> -
Efectuarea de modelare avansată a proceselor de afaceri și a scenariilor care ar putea fi
Gândiți-vă la ceea ce se află în spatele fiecărei misiuni de afaceri din lista precedentă:
-
O cantitate mare de date
-
numărul de combinații de date diferite
-
Analiza setului de rezultate intensive, implicând de obicei algoritmi complexe și tehnici statistice avansate
Acum, gândiți-vă la ceea ce ar trebui să faceți dacă utilizați un instrument de raportare sau OLAP pentru a îndeplini aceste misiuni. Considerați că este practic imposibil să efectuați toate misiunile anterioare dacă ar trebui să puneți o întrebare și să obțineți un rezultat, să întrebați o altă întrebare și să obțineți un alt rezultat și apoi să repetați acești pași.
Exploatarea de date și inteligența artificială
Dacă ați fost în domeniul tehnologiei informației (IT) timp de cel puțin un deceniu, unii dintre termenii precedenți s-ar putea suna cam vag familiar.Deblocarea cunoștințelor ascunse? Funcționalitate predictivă? Așteaptă un minut - asta e inteligența artificială!
De la primele zile de calcul comercial, a existat un interes extraordinar în dezvoltarea "mașinilor de gândire" care pot procesa cantități mari de date și pot lua decizii pe baza acestei analize.
Interesul în inteligența artificială (AI) a lovit zenitul său la mijlocul anilor 1980. La acel moment, furnizorii de baze de date au lucrat la producerea sistemelor de management al bazelor de cunoștințe (KBMS); alți furnizori au ieșit împreună cu cochilii de sistem expert, sau cadre de dezvoltare a aplicațiilor bazate pe AI care foloseau tehnici cum ar fi legarea înainte și înlănțuirea înapoi pentru a sfătui utilizatorii cu privire la decizii; și rețelele neuronale au fost poziționate ca fiind următoarea dezvoltare AI mare.
Interesul pentru AI a scăzut la începutul anilor 1990, când așteptările au depășit capacitățile disponibile și alte fenomene, cum ar fi migrarea clienților / serverului și, bineînțeles, depozitarea datelor, au avut loc în centrul atenției.
Acum, AI se întoarce!
Tehnica cel mai înalt profil AI utilizată în exploatarea datelor este rețelele neuronale. Plasele neuronale au fost inițial concepute ca un model de procesare care să imite felul în care creierul uman rezolvă problemele, folosind neuroni și procesarea extrem de paralelă pentru a face rezolvarea de modele.
Aplicarea algoritmilor rețelei neuronale în zonele de inteligență a afacerii pe care le gestionează datele miniere (din nou, predictive și misiuni "spune-mi ceva interesant") pare a fi un meci natural.
Deși jocul de date mining / rețea neuronală merită cu siguranță să fie verificat, ar trebui să o faceți cu atenție. Puteți găsi o mulțime de tehnologii interesante și interesante care, în mâinile celor care nu înțeleg algoritmii, vor eșua probabil.
Cu toate acestea, cu o cunoaștere și o educație adecvată, puteți face un angajament pe scară largă de a aduce acest tip de procesare în cadrul dvs. de inteligență a afacerii dvs. ca o pereche de analize tehnice pentru analiza de afaceri concentrată pe OLAP.
Explorarea datelor și statisticile
Suprafața mai matură a activităților de extragere a datelor este aplicarea unor tehnici statistice avansate împotriva volumelor mari de date din depozitul de date. Instrumentele diferite utilizează diferite tipuri de tehnici statistice, adaptate la zonele pe care încearcă să le abordeze.
Fără o experiență statistică, s-ar putea să găsiți o mare parte din mintea de date confuză. Trebuie să faceți o mulțime de lucruri pentru a instrui algoritmii și pentru a construi regulile pentru a vă asigura rezultate adecvate cu seturi de date mai mari. Cu toate acestea, presupunând că sunteți confortabil cu acest concept sau dacă aveți un coleg care vă poate ajuta, iată câțiva dintre algoritmii cu mai mare influență:
-
Algoritmi de clasificare: Preziceți una sau mai multe variabile discrete, bazate pe cealaltă atribute în setul de date. Folosind algoritmi de clasificare, instrumentul de extragere a datelor poate analiza cantități mari de date și apoi vă informează că, de exemplu, "Clienții care sunt reținuți prin cel puțin două generații de achiziții de produse tind să aibă aceste caracteristici: Ei au un venit de cel puțin 75 000 de dolari, și își dețin propriile case."
-
Algoritmi de regresie: Preziceți una sau mai multe variabile continue, cum ar fi profitul sau pierderea, pe baza altor atribute din setul de date. Algoritmii de regresie sunt conduse prin intermediul informațiilor istorice prezentate în instrumentul de extragere a datelor "în timp", mai bine cunoscut sub numele de informații despre seria de timp .
-
Algoritmi de segmentare: Împărțiți datele în grupuri sau grupuri de elemente care au proprietăți similare.
-
Algoritmi de asociere: Găsiți corelații între diferite atribute dintr-un set de date. Aplicația cea mai comună a acestui tip de algoritm creează reguli de asociere, pe care le puteți utiliza într-o analiză a coșului de piață. Rețineți că, de exemplu, în cazul în care un client achiziționează un anumit pachet software, acesta are o șansă de 65% de a achiziționa cel puțin două pachete de produse suplimentare în interval de două săptămâni.
-
Algoritmi de analiză a secvenței: Rezumați secvențele sau episoadele frecvente din date, cum ar fi un flux al căii web.
Există multe metode. Desprindeți vechea carte de statistici și începeți să citiți.