Pentru a face o scurtă poveste, Hive oferă Hadoop cu o punte către lumea RDBMS și oferă un dialect SQL cunoscut sub numele de Hive Query Language (HiveQL Language), care poate fi utilizat pentru a efectua sarcini asemănătoare SQL. Aceasta este vestea cea mare, dar este mai mult ca Hive să se întâlnească cu ochii, după cum se spune, sau cu mai multe aplicații ale acestei noi tehnologii decât puteți să vă prezentați într-un pitch standard al ascensorului.
De exemplu, Hive face posibilă și conceptul cunoscut sub denumirea de Enterprise Enterprise Data Warehouse (EDW), un caz de conducere pentru Apache Hadoop, unde depozitările de date sunt configurate ca RDBMS-uri construite special pentru analiza și raportarea datelor.
Acum, unii experți vor argumenta că Hadoop (cu Hive, HBase, Sqoop și prietenii săi asortați) poate înlocui EDW. Cu toate acestea, Apache Hadoop este o adunare minunată pentru întreprindere și că poate să crească și să completeze EDW-urile existente. Nivelul, HBase și Sqoop permit creșterea EDW.
Clar asociat cu tehnologia RDBMS / EDW este tehnologia de extracție, transformare și încărcare (ETL). Pentru a înțelege ce face ETL, ajută să știm că, în multe cazuri de utilizare, datele nu pot fi încărcate imediat în baza de date relațională - trebuie mai întâi să fie extrase din sursa sa nativă, transformate într-un format adecvat și apoi încărcate în RDBMS EDW.
Puteți vedea că Hive este un instrument puternic ETL în sine, împreună cu principalul jucător din acest domeniu: Apache Pig. Din nou, utilizatorii pot încerca să instaleze Ulu și Pig cainstrumentele ETL noi pentru centrul de date. (Lăsați-i să încerce.) înlocuitoare
s directe pentru instrumentele ETL existente, ci în schimb sunt instrumente puternice ETL noi utilizat atunci când este cazul. Nu în ultimul rând, Apache Hive vă oferă instrumente analitice puternice, toate în cadrul programului HiveQL. Aceste instrumente ar trebui să arate și să se simtă destul de familiare profesioniștilor IT care înțeleg cum să utilizeze SQL.