Acasă Finanțe personale Elementele fundamentale ale platformei mari de date gestionează date în moduri noi, cum ar fi

Elementele fundamentale ale platformei mari de date gestionează date în moduri noi, cum ar fi

Video: Viktor Schauberger - Comprehend and Copy Nature (Documentary of 2008) 2024

Video: Viktor Schauberger - Comprehend and Copy Nature (Documentary of 2008) 2024
Anonim

Elementele fundamentale ale platformei mari de date gestionează date în moduri noi în comparație cu baza de date tradițională relațională. Acest lucru se datorează nevoii de a avea scalabilitatea și performanțele ridicate necesare pentru gestionarea atât a datelor structurate, cât și a celor nestructurate.

Componentele ecosistemului mare de date, de la Hadoop la NoSQL DB, MongoDB, Cassandra și HBase, toate au abordarea proprie pentru extragerea și încărcarea datelor. Ca rezultat, echipele dvs. ar putea avea nevoie să dezvolte noi abilități pentru a gestiona procesul de integrare pe aceste platforme. Cu toate acestea, multe dintre cele mai bune practici de gestionare a datelor ale companiei dvs. vor deveni și mai importante pe măsură ce vă deplasați în lumea datelor importante.

În timp ce datele mari introduc un nou nivel de complexitate a integrării, principiile fundamentale fundamentale se aplică în continuare. Obiectivul dvs. de afaceri trebuie să se concentreze pe furnizarea de date de calitate și de încredere organizației la momentul potrivit și în contextul potrivit.

Pentru a vă asigura această încredere, trebuie să stabiliți reguli comune pentru calitatea datelor, cu accent pe exactitatea și caracterul complet al datelor. În plus, aveți nevoie de o abordare cuprinzătoare pentru dezvoltarea metadatelor companiei, urmărirea liniei de date și a guvernanței pentru a sprijini integrarea datelor dvs.

Pentru a lua decizii de afaceri solide pe baza unei analize de date, aceste informații trebuie să fie sigure și înțelese la toate nivelurile organizației. Deși, probabil, nu va fi costul sau timpul eficient de a fi preocupat prea mult de calitatea datelor în etapa de explorare a unei analize de date mari, eventual, calitatea și încrederea trebuie să joace un rol dacă rezultatele trebuie încorporate în procesul de afaceri.

Informațiile trebuie furnizate întreprinderii într-o manieră sigură, controlată, consecventă și flexibilă în cadrul întreprinderii, indiferent de cerințele specifice fiecărui sistem sau aplicație. Pentru a atinge acest obiectiv, se aplică trei principii de bază:

Trebuie să creați o înțelegere comună a definițiilor de date.

  • În stadiile inițiale ale analizei dvs. de mari dimensiuni, este puțin probabil să aveți același nivel de control asupra definițiilor de date ca și în cazul datelor dvs. operaționale.Cu toate acestea, odată ce ați identificat modelele cele mai relevante pentru afacerea dvs., aveți nevoie de capacitatea de a cartografia elementele de date la o definiție comună. Trebuie să dezvoltați un set de servicii de date pentru a califica datele și a le face consecvente și, în cele din urmă, de încredere.

  • Când sursele de date nestructurate și mari sunt integrate cu date operaționale structurate, trebuie să fii încrezător că rezultatele vor avea semnificație. Aveți nevoie de o modalitate simplificată de integrare a surselor mari de date și a sistemelor de înregistrare.

  • Pentru a lua decizii bune pe baza rezultatelor analizei de date mari, trebuie să furnizați informații la momentul potrivit și cu contextul potrivit. Procesul dvs. mare de integrare a datelor ar trebui să asigure coerența și fiabilitatea. Pentru a integra datele în medii de aplicații mixte, obțineți datele dintr-un mediu de date (sursă) într-un alt mediu de date (țintă). Tehnologiile de extracție, transformare și încărcare (ETL) au fost utilizate pentru a realiza acest lucru în mediile tradiționale de depozitare a datelor. Rolul ETL evoluează pentru a face față unor medii mai moderne de gestionare a datelor, cum ar fi Hadoop.

Într-un mediu de date mare, este posibil să fie nevoie să combinați instrumente care susțin procesele de integrare în lot (folosind ETL) cu integrarea în timp real și federarea în mai multe surse. De exemplu, o companie farmaceutică ar putea avea nevoie să amestece datele stocate în sistemul său Master Data Management (MDM) cu mari surse de date privind rezultatele medicale ale consumului de droguri ale consumatorilor.

Companiile utilizează MDM pentru a facilita colectarea, agregarea, consolidarea și furnizarea de date coerente și fiabile în mod controlat în întreaga întreprindere. În plus, noi instrumente precum Sqoop și Scribe sunt folosite pentru a sprijini integrarea mediilor de date mari. De asemenea, veți găsi un accent sporit pe utilizarea tehnologiilor de extragere, încărcare și transformare (ELT). Aceste tehnologii sunt descrise în continuare.

Elementele fundamentale ale platformei mari de date gestionează date în moduri noi, cum ar fi

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...