Acasă Finanțe personale Atributele HBase - dummies

Atributele HBase - dummies

Cuprins:

Video: Dumnezeu este sfânt - Atributele lui Dumnezeu - Mesaj Marius Ștefănescu 2024

Video: Dumnezeu este sfânt - Atributele lui Dumnezeu - Mesaj Marius Ștefănescu 2024
Anonim

HBase (baza de date Hadoop) este o implementare Java a lui BigTable. Google definește BigTable ca o "hartă tridimensională, distribuită, persistentă, multidimensională. "Este o definiție destul de concisă, dar veți fi, de asemenea, de acord că este puțin pe partea complexă. Pentru a distruge complexitatea lui BigTable un pic, în urma este o discuție a fiecărui atribut.

Hbase este rar

După cum probabil ați ghicit, sistemul de stocare a datelor distribuit de BigTable a fost conceput pentru a răspunde cerințelor unor date mari. Acum, aplicațiile mari de date stochează o mulțime de date, dar conținutul mare de date este, de asemenea, adesea variabil. Imaginați-vă o masă tradițională într-o bază de date a companiei care stochează informațiile de contact ale clienților, așa cum se arată:

Numele de mijloc

Adresa de e-mail Adresa de strada 00001 Smith Ioan Timotei 1 Hadoop Lane, NY 11111 00002 Doe Jane O companie sau o persoană poate solicita o înregistrare completă a datelor pentru fiecare dintre clienții sau constituenții săi. Un bun exemplu este medicul dumneavoastră, care are nevoie de toate informațiile de contact pentru a vă oferi îngrijirea corespunzătoare. Alte companii sau persoane fizice pot solicita numai informații de contact parțiale sau pot avea nevoie să învețe acele informații în timp.

De exemplu, o companie de servicii pentru clienți poate procesa apeluri telefonice sau mesaje e-mail pentru cererile de servicii. Clienții pot sau nu pot alege să ofere companiilor de servicii toate informațiile de contact ale acestora. Cu toate acestea, cu fiecare interacțiune de-a lungul timpului, companiile pot afla mai multe despre clienții lor, ceea ce le va permite să ofere servicii mai bune - prin emiterea de alerte proactive de serviciu, de exemplu. În acest context, sparse înseamnă că câmpurile din rânduri pot fi goale sau NULL, dar care nu aduc HBase la o întrerupere. HBase se poate ocupa de faptul că nu (încă) cunoașteți numele de mijloc și adresa de e-mail a lui Jane Doe, de exemplu.

Iată un alt exemplu: o bază de date pentru stocarea imaginilor prin satelit. Se pare că Google folosește tehnologia BigTable pentru a stoca imaginile prin satelit ale pământului. În aproape fiecare caz, ori de câte ori imaginile sunt stocate, metadatele sunt de asemenea stocate împreună cu acestea.

Metadatele pot include adresa stradală a imaginii sau numai latitudinea și longitudinea în cazul în care imaginea este capturată din sălbăticie. Metadatele sunt variabile în conținut, astfel că unele câmpuri vor fi NULL - și este OK.

În ambele exemple, seturile de date colectate pot fi extrem de mari - în special în al doilea exemplu.Imaginile bazelor de date sunt aproape întotdeauna măsurate în terabytes sau uneori în petabytes. HBase este proiectat pentru stocarea de date mari, dar este, de asemenea, proiectat pentru stocarea înregistrărilor rare de date fără costuri. Această preocupare este crucială atunci când utilizați aplicații de date mari! Stocarea câtorva înregistrări NULL peste un milion de rânduri este risipă, dar încercați să vă imaginați deșeurile pe o rată de patru miliarde! Din fericire, acesta a fost un aspect important pentru designerii Google și comunitatea HBase. Datele rare sunt suportate fără pierderi de spațiu de stocare costisitor.

Și nu se oprește acolo. Luați în considerare puterea unui depozit de date fără schemă. Tabelul vă prezintă o tabel clasic de contact pentru clienți. Când companiile proiectează aceste mese, știu în față ceea ce vor să stocheze. Cu alte cuvinte, schema este

fixată

; este definit chiar înainte ca primul octet de informații să fie stocat în tabel.

Ce se întâmplă dacă, în timp, este nevoie de un nou domeniu pentru un client? Ce zici de un mâner Twitter sau de un nou număr de telefon mobil? Sunteți aparent blocați de o schemă care nu mai funcționează pentru dvs.

Ei bine, HBase rezolvă și această provocare - nu poți doar să ignori câmpurile fără costuri atunci când nu ai date, ci și să adaugi dinamic câmpuri (sau

coloane

în limbajul HBase) fără a trebui să reproiectați schema sau să întrerupeți operațiile. Deci, vă puteți gândi la HBase ca la un magazin de date fără schemă; adică este fluid - puteți adăuga, scădea sau modifica schema pe măsură ce mergeți. HBase este distribuit și persistent

BigTable este un magazin de date distribuit și persistent.

Permanent pur și simplu înseamnă că datele stocate în BigTable (și HBase, de pildă) vor persista sau vor rămâne după terminarea programului sau a sesiunii. Este destul de simplu - persistent înseamnă că persistă - dar ar trebui să vă petreceți mai mult timp gândindu-vă la cum

datele persistă.

În hârtia BigTable, Google a descris sistemul de fișiere distribuit cunoscut sub numele de Google File System sau GFS. Se pare că, așa cum HBase este o implementare open source a BigTable, HDFS este o implementare open source a GFS.

În mod implicit, HBase utilizează HDFS pentru a-și persista datele pe spațiul de stocare pe disc. Cu toate că alte distribuții de date distribuite pot fi utilizate cu HBase, marea majoritate a instalațiilor HBase utilizează HDFS. Acest lucru are sens, având în vedere faptul că HBase este "Baza de date Hadoop" - hei, este construită în nume, pentru bunăvoință. HDFS este o tehnologie de bază care permite nu numai Hadoop, ci și HBase. Prin stocarea datelor în HDFS, HBase oferă fiabilitate, disponibilitate, scalabilitate fără probleme, performanță ridicată și multe altele - toate pe servere distribuite rentabile! HBase are o hartă clasificată multidimensională Pornind de la elementele de bază, o hartă

(cunoscută și ca

matrice asociativă) este o colecție abstractă de perechi cheie-valoare cheia este unică. Această definiție este crucială pentru înțelegerea dvs. de HBase, deoarece modelul de date HBase este deseori descris în moduri diferite - adesea incomplet ca un magazin orientat pe coloane.

HBase este, în partea de jos, un magazin de date cu valoare cheie în care fiecare cheie este unică - ceea ce înseamnă că apare cel mult o dată în depozitul de date HBase. În plus, harta este sortată și multidimensională. Cheile sunt stocate în HBase și sortate în ordine octet-lexicografică. Fiecare valoare poate avea mai multe versiuni, ceea ce face modelul de date multidimensional. Implicit, versiunile de date sunt implementate cu un marcaj de timp.

Atributele HBase - dummies

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...