Video: Robin From Stranger Things Is Already Iconic 2024
Hadoop este un ecosistem bogat și rapid, cu un număr tot mai mare de aplicații noi. Mai degrabă decât să încercați să respectați toate cerințele pentru noi capabilități, Pig este proiectat să fie extensibil prin funcții definite de utilizator , cunoscute și sub denumirea de UDF.
UDF-urile pot fi scrise într-un număr de limbi de programare, inclusiv Java, Python și JavaScript. De asemenea, dezvoltatorii postarea și partajarea online a unei colecții tot mai mari de UDF-uri. (Uita-te pentru Piggy Bank și DataFu, pentru a numi doar două exemple de astfel de colecții on-line) Unele UDF porc care fac parte din aceste depozite sunt funcții LOAD / STORE (de exemplu, XML), funcții de date date, și funcțiile statistice.
Porcul poate fi încorporat și în limbile de gazdă, cum ar fi Java, Python și JavaScript, ceea ce vă permite integrarea porcului cu aplicațiile existente. De asemenea, ajută la depășirea limitelor limbii de porc. Una dintre cele mai frecvent menționate limitări este aceea că Porcul nu suportă declarațiile de flux de control: dacă / altceva, în timp ce buclă, pentru buclă și declarații condiție.
Porcul sprijină nativ fluxul de date, dar trebuie să fie încorporat într-o altă limbă pentru a asigura fluxul de control. Există compromisuri, totuși de a încorpora porc într-un limbaj de control-flow. De exemplu, dacă o declarație Pig este încorporată într-o buclă, de fiecare dată când bucla iterează și execută instrucțiunea Pig, aceasta determină o lucrare separată MapReduce pentru a rula.