Video: Clientul a decis, de asemenea, să plătească cu bomboane 2024
Primul client Hive este interfața de linie de comandă Hive (CLI). Pentru a stăpâni punctele mai fine ale clientului Hive CLI, ar putea ajuta la revizuirea arhitecturii de tip Hive (oarecum ocupată).
În cea de-a doua figură, arhitectura este raționalizată pentru a se concentra doar pe componentele necesare atunci când rulează CLI.
Acestea sunt componentele stupului care sunt necesare atunci când rulează CLI pe un cluster Hadoop. Aici, executați stilul Hive în modul local, care utilizează stocarea locală, mai degrabă decât HDFS, pentru datele dvs.
Pentru a rula CLU Hive, executați comanda Hive și specificați CLI ca serviciu pe care doriți să-l executați. În lista următoare, puteți vedea comanda necesară și câteva dintre primele noastre declarații HiveQL. (O adnotare de pași utilizând modelul A-B-C este inclusă în listă pentru a vă îndrepta atenția asupra comenzilor cheie.)
(A) $ $ HIVE_HOME / bin stup - serviciul cli (B) stup. cli. imprimare. actual. db = true; (C) stup (implicit)> CREATE DATABASE ourfirstdatabase; OK Timp realizat: 3. 756 secunde (D) stup (implicit)> UTILIZEAZA-ne prima data; OK Timp realizat: 0. 039 secunde (E) coloană (ourfirstdatabase)> CREATE TABLE our_first_table (> FirstName STRING,> LastName STRING,> EmployeeId INT); OK Timpul realizat: 0. 043 secunde hive (ourfirstdatabase)> quit; (F) $ ls / home / biadmin / stup / depozit / prima noastră bază de date. db our_first_tablePrima comandă (a se vedea pasul A) pornește CLI-ul Hive utilizând variabila de mediu $ HIVE_HOME. Opțiunea -service cli-line direcționează sistemul Hive pentru a porni interfața de linie de comandă, deși ați fi putut alege alte servere.
Apoi, în Pasul B, îi spuneți CLI-ului Hive să vă tipărească baza de date curentă de lucru, astfel încât să știți unde vă aflați în spațiul de nume. (Această afirmație va avea sens după ce vom explica cum să folosim următoarea comandă, deci țineți-o strânsă.)
În Pasul C utilizați limba de definiție a datelor HiveQL (DDL) pentru a crea prima bază de date. (Amintiți-vă că bazele de date din Hive sunt pur și simplu spații de nume în care se găsesc anumite tabele; deoarece un set de tabele poate fi considerat ca bază de date sau schemă, ați putea folosi termenul SCHEMA în locul DATABASE pentru a realiza același rezultat.
Mai precis, folosiți DDL pentru a spune sistemului să creeze o bază de date numită ourfirstdatabase și apoi să facă această bază de date implicită pentru comenzile ulterioare HiveQL DDL folosind comanda USE în Pasul D. În Pasul E, creați prima tabel și dați numele (destul de adecvat) our_first_table.
(Până acum ați crezut că seamănă foarte mult cu SQL, cu câteva diferențe minore în sintaxă, în funcție de RDBMS cu care sunteți obișnuiți - și ați fi avut dreptate.) Ultima comandă, în Pasul F, realizează o listă cu directorul al directorului de depozit al Hive ales, astfel încât să puteți vedea că our_first_table a fost stocat pe disc.
Ați setat stupul. metastore. depozit. dir pentru a indica directorul local / home / biadmin / Hive / warehouse în mașina virtuală Linux, mai degrabă decât să utilizați HDFS ca pe un cluster adecvat Hadoop.
După ce ați creat o masă, este interesant să vizualizați metadatele tabelului. În mediile de producție, este posibil să aveți zeci de mese sau mai multe, deci este util să puteți revizui din când în când structura tabelului. c o utilizează o comandă HiveQL pentru a face acest lucru folosind Hive CLI, dar serverul Hive Interface Web (HWI) oferă o interfață utilă pentru acest tip de operație.
Utilizarea serverului HWI în loc de CLI poate fi și mai sigură. O atenție deosebită trebuie făcută atunci când se utilizează CLI în medii de producție, deoarece aparatul care rulează CLI trebuie să aibă acces la întregul cluster Hadoop.
De aceea, administratorii de sistem instalează în mod obișnuit instrumente cum ar fi shell-ul securizat (ssh) pentru a asigura accesul controlat și securizat la aparatul care rulează CLI, precum și pentru a oferi criptare în rețea. Cu toate acestea, atunci când serverul HWI este folosit, un utilizator poate accesa numai datele de tip Hive permise de serverul HWI prin intermediul browserului său web.