Video: Leap Motion SDK 2024
fluxurile de lucru Oozie sunt, la baza lor, grafice direcționate, unde puteți defini acțiunile (aplicații Hadoop) și fluxul de date, dar fără buclă - t definiți o structură în care să executați o anumită operațiune în mod repetat până când este îndeplinită o anumită condiție (de exemplu, pentru buclă).
Fluxurile de lucru Oozie sunt destul de flexibile prin faptul că puteți defini deciziile bazate pe condiție și căile forked pentru execuția paralelă. Puteți executa, de asemenea, o gamă largă de acțiuni.
În această figură, vedeți un flux de lucru care prezintă capabilitățile de bază ale fluxurilor de lucru Oozie. Mai întâi, este rulat un script Pig și este imediat urmat de un arbore de decizie. În funcție de starea de ieșire, fluxul de control poate merge fie direct la o operație de fișier HDFS (Hadoop Distributed File System) (de exemplu, o operațiune copyToLocal), fie la o acțiune furcă.
Dacă fluxul de control trece la acțiunea furcii, se execută simultan două lucrări: o lucrare MapReduce și o interogare Hive. Debitul de control merge apoi la operația HDFS odată ce ambele lucrări MapReduce și interogare Hive au terminat să fie difuzate. După operația HDFS, fluxul de lucru este complet.
Definițiile fluxului de lucru Oozie sunt scrise în XML, bazate pe schema Hadoop Process Definition Language (hPDL). Această schemă particulară este, la rândul ei, bazată pe schema XML Language Definition Definition (XPDL), care este un standard independent de produs pentru modelarea definițiilor proceselor de afaceri.
Un flux de lucru Oozie este compus dintr-o serie de acțiuni care sunt codificate de noduri XML. Există diferite tipuri de noduri, reprezentând diferite tipuri de acțiuni sau directive de control al fluxului. Fiecare flux de lucru Oozie are propriul fișier XML, unde fiecare nod și interconexiunile sale sunt definite.
Nodurile fluxului de lucru au nevoie de identificatori unici deoarece sunt folosiți pentru a identifica următorul nod care urmează să fie procesat în fluxul de lucru. Aceasta înseamnă că ordinea în care acțiunile sunt executate depinde de locul în care apare nodul unei acțiuni în fluxul de lucru XML. Pentru a vedea cum ar părea acest concept, verificați următoarea listă, care arată un exemplu de structură de bază a unui fișier XML al fluxului de lucru Oozie.
… … "Loc de muncă ucis."
În acest exemplu, pe lângă nodurile de început, sfârșit și ucide, aveți două noduri de acțiune. Fiecare nod de acțiune reprezintă o aplicație sau o comandă care este executată.