Acasă Finanțe personale Stratul 4 al Big Data Stack: Depozite de date analitice

Stratul 4 al Big Data Stack: Depozite de date analitice

Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024

Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024
Anonim

Depozitul de date, stratul 4 al stivei mari de date și companionul său de date, au fost mult timp tehnicile principale pe care organizațiile le utilizează pentru a optimiza datele pentru a ajuta factorii de decizie. În mod tipic, depozitele de date și marturile conțin date normalizate colectate dintr-o varietate de surse și asamblate pentru a facilita analiza afacerii.

Depozitele de date și marcile simplifică crearea de rapoarte și vizualizarea elementelor de date disparate. Ele sunt create în general din baze de date relaționale, baze de date multidimensionale, fișiere plate și baze de date obiect - în esență, orice arhitectură de stocare. Într-un mediu tradițional, în care performanța poate să nu fie cea mai mare prioritate, alegerea tehnologiei subiacente este determinată de cerințele pentru analiza, raportarea și vizualizarea datelor companiei.

Dat fiind că organizarea datelor și disponibilitatea lor de a fi analizate sunt esențiale, cele mai multe implementări ale depozitului de date sunt păstrate curent prin procesarea loturilor. Problema este că depozitele de date încărcate în lot și martorurile de date pot fi insuficiente pentru multe aplicații de date mari. Stresul impus de fluxurile de date de mare viteză va necesita probabil o abordare mai realistă a depozitelor mari de date.

Acest lucru nu înseamnă că nu veți crea și nu veți hrăni un depozit de date analitic sau un centru de date cu procese discontinue. Mai degrabă, este posibil să ajungeți la mai multe depozite de date sau la date, iar performanța și scara vor reflecta cerințele de timp ale analiștilor și factorilor de decizie.

Deoarece numeroase depozite de date și martori de date sunt compuse din date colectate din diferite surse din cadrul unei companii, costurile asociate cu curățarea și normalizarea datelor trebuie, de asemenea, abordate. Cu date mari, veți găsi câteva diferențe-cheie:

  • Fluxurile tradiționale de date (din tranzacții, aplicații și așa mai departe) pot produce o mulțime de date disparate.

  • De asemenea, există zeci de noi surse de date, fiecare dintre ele având nevoie de un anumit grad de manipulare înainte de a putea fi în timp util și util pentru afacere.

  • Sursele de conținut vor trebui, de asemenea, să fie curățate și acestea pot necesita tehnici diferite de cele pe care le puteți folosi cu date structurate.

Din punct de vedere istoric, conținutul depozitelor de date și al martorilor de date a fost organizat și livrat liderilor de afaceri responsabili cu strategia și planificarea. Cu date mari, un nou set de echipe utilizează date pentru luarea deciziilor.

Multe implementări de date mari oferă capabilități în timp real, astfel încât întreprinderile ar trebui să poată furniza conținut pentru a permite persoanelor cu roluri operaționale să abordeze aspecte precum asistența pentru clienți, oportunitățile de vânzări și întreruperile de servicii în timp real.În acest fel, datele mari vă ajută să mutați acțiunile de la biroul de back office la biroul de la fața locului.

Instrumentele și tehnicile de analiză existente vor fi foarte utile în ceea ce privește înțelegerea datelor importante. Cu toate acestea, există o captură. Algoritmii care fac parte din aceste instrumente trebuie să poată lucra cu cantități mari de date potențial în timp real și disparate. Infrastructura va trebui să fie în măsură să sprijine acest lucru.

Și furnizorii care furnizează instrumente de analiză vor trebui, de asemenea, să se asigure că algoritmii lor funcționează în cadrul implementărilor distribuite. Din cauza acestor complexități, așteptați o nouă clasă de instrumente care să vă ajute să înțelegeți datele importante.

Există trei clase de instrumente în acest strat al arhitecturii de referință. Acestea pot fi utilizate independent sau colectiv de factorii de decizie pentru a ajuta la direcționarea afacerii. Cele trei clase de instrumente sunt următoarele:

  • Rapoarte și tablouri de bord: Aceste instrumente furnizează un & user-friendly & rdquo; reprezentarea informațiilor din diferite surse. Deși un suport în lumea tradițională a datelor, această zonă este în continuă evoluție pentru date importante. Unele dintre instrumentele utilizate sunt cele tradiționale care pot accesa acum noile tipuri de baze de date colectiv numite NoSQL (Not Only SQL).

  • Vizualizare: Aceste instrumente reprezintă următorul pas în evoluția rapoartelor. Producția tinde să aibă o natură extrem de interactivă și dinamică. O altă deosebire importantă între rapoarte și ieșiri vizualizate este animația. Utilizatorii de afaceri pot urmări schimbările din date folosind o varietate de tehnici de vizualizare diferite, incluzând hărți de minte, hărți termice, infografice și diagrame de conexiuni. Raportarea și vizualizarea apar la sfârșitul activității de afaceri.

  • Analytics și analize avansate: Aceste instrumente ajung în depozitul de date și procesează datele pentru consumul uman. Analizele avansate ar trebui să explice tendințe sau evenimente care sunt transformative, unice sau revoluționare față de practica de afaceri existentă. Analizele predictive și analiza sentimentelor sunt exemple bune ale acestei științe.

Stratul 4 al Big Data Stack: Depozite de date analitice

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...