Apache-ul Apache - Aplicații - Finanțe personale 2024

Video: Emulator Web ce are inclus Softaculous cu 356 aplicatii Web 2024

Apache Hive este indiscutabil cea mai răspândită interfață de interogare a datelor din comunitatea Hadoop. Inițial, obiectivele de proiectare pentru Hive nu erau pentru compatibilitate completă cu SQL și pentru performanțe ridicate, ci pentru a oferi o interfață ușoară, oarecum familiară pentru dezvoltatorii care ar fi trebuit să lanseze interogări batch împotriva lui Hadoop.

Această abordare destul de fragmentată nu mai funcționează, astfel încât cererea crește pentru suport SQL real și performanță bună. Hortonworks a răspuns acestei solicitări creând proiectul Stinger, unde a investit resursele pentru dezvoltatori în îmbunătățirea stupului pentru a fi mai rapid, pentru a scala la un nivel petabyte și a fi mai conform cu standardele SQL. Această lucrare trebuia să se desfășoare în trei faze.

În fazele 1 și 2, ați văzut o serie de optimizări pentru modul în care au fost procesate interogările și a adăugat suport pentru tipurile tradiționale de date SQL; adăugarea formatului ORCFile pentru procesarea și stocarea mai eficiente; și integrarea cu YARN pentru o performanță mai bună.

În faza 3, au loc evoluții cu adevărat semnificative, care decuplează stupul de la MapReduce. Mai exact, aceasta implică lansarea Apache Tez, un model alternativ de procesare pentru Hadoop, conceput pentru încărcări interactive.