Video: CLOUDERA y ecosistema HADOOP: Qué es en 2 minutos - Aprender BIG DATA #4 2024
Cloudera este un furnizor de software și servicii Apache Hadoop. Ca și Apache Drill, tehnologia Impala de la Cloudera încearcă să îmbunătățească timpul de răspuns al interogării interactive pentru utilizatorii Hadoop. Apache Hive a oferit un mecanism familiar și puternic de interogare pentru utilizatorii Hadoop, dar timpul de răspuns al interogărilor este adesea inacceptabil datorită faptului că Hive se bazează pe MapReduce. Răspunsul lui Cloudera la această problemă este Impala.
Cloudera a dezvoltat un motor de interogare MPP, scris în C ++, pentru a înlocui stratul MapReduce utilizat de Apache Hive. Spre deosebire de Dremel și Drill, Cloudera a decis că un motor nativ C ++ MPP - în loc de un motor Java - a fost răspunsul pentru interogări rapide, interactive Hadoop.
Rețineți că Impala utilizează interfața de programare HiveQL, iar motoarele Impala Query Exec sunt co-localizate cu nodurile de date HDFS, în conformitate cu abordarea Hadoop de co-localizare a datelor cu sarcini de procesare. Impala poate utiliza, de asemenea, HBase ca un magazin de date. În acest sens, Impala este o extensie a Apache Hadoop, oferind o alternativă foarte performantă la modelul Hive-on-top-of-MapReduce.
Puteți găsi tehnologia Impala de la Cloudera, care a fost inspirată de invenția Google Dremel.