Acasă Finanțe personale Identificați datele de care aveți nevoie pentru datele dvs. mari - manechine

Identificați datele de care aveți nevoie pentru datele dvs. mari - manechine

Cuprins:

Video: The Mind After Midnight: Where Do You Go When You Go to Sleep? 2024

Video: The Mind After Midnight: Where Do You Go When You Go to Sleep? 2024
Anonim

Rețineți tipul de date cu care vă confruntați în proiectul dvs. de date. Multe organizații recunosc faptul că o mulțime de date generate intern nu a fost folosită la întregul său potențial în trecut.

Folosind noi instrumente, organizațiile câștigă o nouă perspectivă asupra surselor nefolosite anterior de date nestructurate în e-mailuri, în înregistrările de servicii pentru clienți, în datele senzorilor și în jurnalele de securitate. În plus, există mult interes în căutarea unei noi perspective bazate pe analiza datelor care sunt în primul rând externe organizației, cum ar fi mass-media socială, locația telefonului mobil, traficul și vremea.

Stadiul exploratoriu pentru date mari

În primele etape ale analizei dvs., veți dori să căutați modele în date. Numai examinând volume foarte mari de date se pot observa relații noi și neașteptate și corelații între elemente. Aceste modele pot oferi o perspectivă asupra preferințelor clienților pentru un produs nou, de exemplu. Veți avea nevoie de o platformă pentru organizarea datelor dvs. mari pentru a căuta aceste modele.

Hadoop este utilizat pe scară largă ca un bloc de bază pentru captarea și procesarea datelor de anvergură. Hadoop este proiectat cu capabilități care accelerează procesarea datelor mari și fac posibilă identificarea modelelor în cantități mari de date într-un timp relativ scurt. Cele două componente principale ale sistemelor distribuite de fișiere Hadoop - Hadoop (HDFS) și MapReduce - sunt utilizate pentru a gestiona și prelucra datele dvs. mari.

Adesea este necesar să colectăm, să agregăm și să mutăm cantități extrem de mari de date streaming pentru a căuta modele ascunse în date mari. Instrumentele de integrare tradiționale, cum ar fi ETL, nu ar fi suficient de rapide pentru a muta fluxurile mari de date în timp pentru a furniza rezultate pentru analize, cum ar fi detectarea fraudelor în timp real. FlumeNG încarcă date în timp real prin streamingul datelor în Hadoop.

De obicei, Flume este folosit pentru a colecta cantități mari de date de jurnal de la servere distribuite. Acesta ține evidența tuturor nodurilor fizice și logice dintr-o instalație Flume. Nodurile de agenți sunt instalate pe servere și sunt responsabile pentru gestionarea modului în care un singur flux de date este transferat și procesat de la punctul său de început la punctul de destinație.

În plus, colectorii sunt utilizați pentru a grupa fluxurile de date în fluxuri mai mari care pot fi scrise într-un sistem de fișiere Hadoop sau într-un alt container mare de stocare a datelor. Flume este proiectat pentru scalabilitate și poate continua să adauge mai multe resurse într-un sistem pentru a gestiona cantități extrem de mari de date într-un mod eficient.Producția Flume poate fi integrată cu Hadoop și Hive pentru analiza datelor.

Flume are de asemenea elemente de transformare pentru a putea utiliza datele și poate transforma infrastructura Hadoop într-o sursă de date nestructurată.

Modele în date mari

Veți găsi multe exemple de companii care încep să realizeze avantaje competitive din analizele de date mari. Pentru multe companii, fluxurile de date media sociale devin tot mai mult o componentă integrală a strategiei de marketing digital. În etapa exploratorie, această tehnologie poate fi utilizată pentru a căuta rapid cantități uriașe de date streaming și a scoate în evidență modelele de trend care se raportează la anumite produse sau clienți.

Stadiul de codificare pentru date mari

Cu sute de magazine și multe mii de clienți, aveți nevoie de un proces repetabil pentru a face saltul de la identificarea modelului până la punerea în aplicare a noii selecții de produse și marketingul mai bine orientat. După ce găsiți ceva interesant în analiza mare a datelor, codificați-l și fă-o parte din procesul dvs. de afaceri.

Pentru a codifica relația dintre analiza mare a datelor și datele dvs. operaționale, trebuie să integrați datele.

Etapa de integrare și încorporare de date

Datele mari au un impact major asupra numeroaselor aspecte ale gestionării datelor, inclusiv a integrării datelor. În mod tradițional, integrarea datelor sa axat pe mișcarea datelor prin intermediul middleware-ului, inclusiv specificațiile privind transmiterea mesajelor și cerințele pentru interfețele de programare a aplicațiilor (API). Aceste concepte de integrare a datelor sunt mai potrivite pentru gestionarea datelor în stare de repaus, decât a datelor în mișcare.

Mutarea în noua lume a datelor nestructurate și a datelor streaming modifică noțiunea convențională de integrare a datelor. Dacă doriți să includeți analiza datelor streaming în procesul dvs. de afaceri, aveți nevoie de o tehnologie avansată suficient de rapidă pentru a vă permite să luați decizii în timp real.

După ce ați finalizat analiza mare a datelor, aveți nevoie de o abordare care vă va permite să integrați sau să încorporați rezultatele analizei dvs. de mari dimensiuni în procesul dvs. de afaceri și în acțiunile de afaceri în timp real.

Companiile au așteptări mari pentru obținerea unei valori reale a afacerilor din analiza datelor. De fapt, multe companii ar dori să înceapă o analiză mai profundă a datelor mari generate intern, cum ar fi datele din jurnalele de securitate, care nu au fost posibile anterior datorită limitărilor tehnologice.

Tehnologiile pentru transportul rapid de date foarte mari și rapide sunt o cerință pentru integrarea între sursele mari de date distribuite și între datele mari și datele operaționale. Sursele de date nestructurate trebuie adesea deplasate rapid pe distanțe geografice mari pentru partajarea și colaborarea.

Legarea surselor tradiționale cu date mari este un proces cu mai multe etape, după ce ați analizat toate datele din streaming mari surse de date și ați identificat modelele relevante. După reducerea cantității de date de care aveți nevoie pentru a gestiona și a analiza, acum trebuie să vă gândiți la integrare.

Identificați datele de care aveți nevoie pentru datele dvs. mari - manechine

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...