Video: How we afford to travel full time, becoming a travel blogger, etc | Q&A 2024
În centrul său, Pig Latin este o limbă flux de date , unde definiți un flux de date și o serie de transformări care se aplică datelor prin intermediul aplicației dvs. Acest lucru este în contrast cu o limbă flux de control (cum ar fi C sau Java), unde scrieți o serie de instrucțiuni.
În limbile de flux de control, folosiți constructe ca buclele și logica condițională (cum ar fi o instrucțiune if). Nu veți găsi bucle și dacă afirmațiile în limba latină.
A = LOAD 'data_file. txt';. B = GROUP …; … C = FILTRU …;. DUMP B;. STORE C INTO 'Rezultate';Unele dintre textele din acest exemplu arată de fapt limba engleză, nu? Nu prea înfricoșător, cel puțin în acest moment. Privind la fiecare rând, puteți vedea fluxul de bază al unui program Pig. (Rețineți că acest cod poate fi parte a unui script sau poate fi emis pe shell-ul interactiv numit Grunt.)
-
Aici, 'data_file' poate specifica fie un fișier HDFS, fie un director. Dacă este specificat un director, toate fișierele din acel director sunt încărcate în program.
-
Logica transformării este locul în care se desfășoară toate manipulările de date. Aici, puteți să filtrați rândurile care nu sunt de interes, JOIN două seturi de fișiere de date, date GROUP pentru a construi agregări, ORDER rezultate, și face mult, mult mai mult.
-
sau
Store
(STORE) rezultatele într-un fișier undeva. În mod obișnuit, utilizați comanda DUMP pentru a trimite ieșirea pe ecran atunci când depanați programele. Când programul dvs. intră în producție, pur și simplu schimbați apelul DUMP la un apel STORE, astfel încât toate rezultatele de la rularea programelor dvs. să fie stocate într-un fișier pentru prelucrare sau analiză ulterioară.