Video: Apache Drill Introduction 2024
Apache Drill este un proiect candidat în incubatorul Apache. Apache Drill nu este deosebit de bolnav, totuși. Tehnologiile candidaților la Fundația Apache Software (ASF) încep toate ca proiecte incubatoare înainte de a deveni tehnologii oficiale ASF. Puteți citi despre Incubatorul Apache. Puteți citi despre Drill.
Inspirat de tehnologia Google Dremel, obiectivul de performanță declarat pentru Drill este de a permite interogări SQL împotriva unui număr de petabyte sau mai mult de date distribuite pe 10 000 de servere. Figura ilustrează arhitectura Apache Drill.
Puteți vedea că cheia pentru arhitectura Drill sunt serverele DrillBit implementate pe fiecare nod de date. Rețineți că fiecare server include un parser query, compilator, optimizator și runtime, dar există un server DrillBit principal desemnat de serverele Zookeeper, care supraveghează executarea interogărilor și se ocupă de trasarea seturilor intermediare de rezultate într-un singur set de ieșire.
Ca și Dremel, Drill poate coexista și completează MapReduce, dar MapReduce nu este folosit pentru a îndeplini interogările, ca și în Apache Hive. În schimb, motoarele de execuție numite Drillbits au fost dezvoltate de membrii comunității Drill.
Această comunitate își propune să furnizeze interogări de latență redusă pentru aplicații cum ar fi tablouri de bord pentru informații de afaceri în timp real, detectarea fraudei și alte cazuri de utilizare sensibile la timp. Instrumentul Drill suportă tipuri de date imbricate, cum ar fi bufferele pentru protocoalele Avro, JSON și Google. Aceste tipuri de date imbricate permit tabele denormalizate foarte mari.
Echipa de dezvoltare Drill se ocupă, de asemenea, de furnizarea unui suport extensiv SQL prin vizarea conformității SQL2003. În cele din urmă, rețineți că echipa Drill furnizează suport pentru HBase, astfel încât utilizatorii să poată interoga tabelele HBase cu SQL.