Video: Current trends in DB: What The Heck is NoSGL and MongoDB ? (Cont.) 2025
HBase este o bază de date distribuită, nerelațională (coloană) care folosește HDFS ca magazin de persistență pentru proiectele mari de date. Acesta este modelat după Google BigTable și este capabil să găzduiască mese foarte mari (miliarde de coloane / rânduri), deoarece este stratificat pe clusterele Hadoop de hardware de mărfuri.
HBase oferă acces la citire / scriere în timp real la date mari. HBase este foarte configurabil, oferind o mare flexibilitate pentru a rezolva eficient cantități mari de date. Acum, aruncați o privire asupra modului în care HBase vă poate ajuta să răspundeți provocărilor dvs. majore privind datele.
HBase este o bază de date coloană, astfel încât toate datele sunt stocate în tabele cu rânduri și coloane similare sistemelor de gestionare a bazelor de date relaționale (RDBMS). Intersecția unui rând și a unei coloane se numește o celulă. O diferență importantă între tabelele HBase și tabelele RDBMS este versiunea.
Fiecare valoare a celulei include un atribut "versiune", care nu este altceva decât un timbru care identifică în mod unic celula. Versiunea tratează modificările din celulă și face posibilă recuperarea oricărei versiuni a conținutului în cazul în care devine necesară. HBase stochează datele în celule în ordine descrescătoare (folosind timestamp), astfel încât o citire va găsi întotdeauna cele mai recente valori mai întâi.
Coloanele din HBase aparțin unei familii de coloane. Numele de familie al coloanei este folosit ca prefix pentru identificarea membrilor familiei sale. De exemplu, fructele: mărul și fructele: bananele sunt membri ai familiei coloanelor fructelor. Implementările HBase sunt reglate la nivelul familiei coloanelor, deci este important să fiți atenți la modul în care accesați datele și la cât de mari așteptați să fie coloanele.
Rândurile din tabelele HBase au, de asemenea, o cheie asociată cu acestea. Structura cheii este foarte flexibilă. Poate fi o valoare calculată, un șir, sau chiar o altă structură de date. Cheia este utilizată pentru a controla accesul la celulele din rând și acestea sunt stocate în ordine de la valoare mică la valoare mare.
Toate aceste caracteristici alcătuiesc împreună schema. Schema este definită și creată înainte ca orice date să poată fi stocate. Chiar și așa, tabelele pot fi modificate și pot fi adăugate noi familii de coloane după ce baza de date este în funcțiune. Această extensibilitate este extrem de utilă atunci când se ocupă de date mari, deoarece nu cunoașteți întotdeauna varietatea fluxurilor de date.
