Acasă Finanțe personale Comparând Hadoop Distributions - dummies

Comparând Hadoop Distributions - dummies

Video: Develop Your Embedded Applications Faster: Comparing C and Golang - Marcin Pasinski, Mender.io 2024

Video: Develop Your Embedded Applications Faster: Comparing C and Golang - Marcin Pasinski, Mender.io 2024
Anonim

Veți descoperi că ecosistemul Hadoop are multe componente, toate acestea existând ca propriile proiecte Apache. Deoarece Hadoop a crescut considerabil și se confruntă cu unele schimbări semnificative ulterioare, diferite versiuni ale acestor componente ale comunității open source ar putea să nu fie pe deplin compatibile cu alte componente. Acest lucru reprezintă dificultăți considerabile pentru persoanele care doresc să obțină un început independent cu Hadoop prin descărcarea și compilarea de proiecte direct de la Apache.

Red Hat este, pentru mulți oameni, modelul de a câștiga cu succes bani pe piața de software open source. Ceea ce a făcut Red Hat este de a lua Linux (un sistem de operare open source), de a le uni toate componentele necesare, de a construi un instalator simplu și de a oferi suport plătit tuturor clienților.

În același mod în care Red Hat a furnizat un pachet la îndemână pentru Linux, o serie de companii au grupat Hadoop și unele tehnologii conexe în propriile distribuții Hadoop. Această listă descrie cele mai proeminente:

  • Cloudera Enterprise, un produs poziționat de Cloudera în centrul a ceea ce se numește Enterprise Data Hub, include Cloudera Distribution for Hadoop (CDH), o distribuție bazată pe open-source a Hadoop și a proiectelor sale asociate ca managerul său privat Cloudera. De asemenea, este inclus un abonament de suport tehnic pentru componentele principale ale CDH.

    Modelul principal de afaceri al companiei Cloudera se bazează mult timp pe capacitatea sa de a mobiliza distribuția populară a CDH și de a oferi servicii și servicii plătite. În toamna anului 2013, Cloudera a anunțat în mod oficial că se concentrează pe adăugarea de componente proprietare cu valoare adăugată pe lângă Hadoop cu sursă deschisă, pentru a acționa ca un diferențiator.

    De asemenea, Cloudera a făcut o practică obișnuită de a accelera adoptarea codului sursă open-source alfa și beta pentru noile versiuni Hadoop. Abordarea sa este de a lua componentele pe care le consideră mature și de a le moderniza în bibliotecile open source disponibile pentru producție, care sunt incluse în distribuția sa.

    EMC

    : Pivotal HD, distribuția Apache Hadoop de la EMC, integrează nativ tehnologia bazei de date masiv paralel procesare (MPP) (cunoscută anterior ca Greenplum și acum cunoscută sub numele de HAWQ) cu Apache Hadoop.Rezultatul este o distribuție de înaltă performanță Hadoop cu procesare SQL adevărată pentru Hadoop. Întrebările bazate pe SQL și alte instrumente de inteligență de afaceri pot fi folosite pentru a analiza datele stocate în HDFS.

  • Hortonworks : Un alt jucător important pe piața Hadoop, Hortonworks are cel mai mare număr de comitete și contribuitori de cod pentru componentele ecosistemului Hadoop. (Committers sunt gatekeepers de proiecte Apache și au puterea de a aproba modificările de cod.)

  • Hortonworks este un spin-off de la Yahoo!, care a fost pilotul inițial al companiei Hadoop, deoarece avea nevoie de o platformă pe scară largă pentru a-și susține afacerile cu motoarele de căutare. Dintre toți vânzătorii de distribuție Hadoop, Hortonworks este cel mai angajat al mișcării open source, bazat pe volumul mare al activităților de dezvoltare pe care le aduce comunității și deoarece toate eforturile de dezvoltare sunt eventual pliate în baza de cod open source. Modelul de afaceri Hortonworks se bazează pe capacitatea sa de a-și mobiliza distribuția populară a HDP și de a oferi servicii și suport plătite. Cu toate acestea, nu vinde software proprietar. Mai degrabă, compania susține cu entuziasm ideea de a lucra în cadrul comunității open source pentru a dezvolta soluții care să răspundă cerințelor de caracteristică a întreprinderii (de exemplu, procesarea mai rapidă a interogărilor cu stupi).

    Hortonworks a falsificat o serie de relații cu companii înființate în industria de gestionare a datelor: Teradata, Microsoft, Informatica și SAS, de exemplu. Deși aceste companii nu au propria lor ofertă Hadoop, ei colaborează cu Hortonworks pentru a oferi soluții integrate Hadoop cu seturi de produse proprii.

    Oferta Hortonworks Hadoop este Hortonworks Data Platform (HDP), care include Hadoop, precum și instrumente și proiecte conexe. De asemenea, spre deosebire de Cloudera, Hortonworks lansează doar versiuni HDP cu cod la nivel de producție din comunitatea open source.

    IBM

    : Big Blue oferă o gamă largă de oferte Hadoop, cu accent pe valoarea adăugată pe partea superioară a stivei Hadoop cu sursă deschisă.

  • Intel: Distribuția Intel pentru Apache Hadoop (Intel Distribution) oferă procesare distribuită și gestionare a datelor pentru aplicații de întreprindere care analizează date mari.

  • Caracteristicile cheie includ performanțe excelente cu optimizări pentru procesoare Intel Xeon, stocare Intel SSD și rețele Intel 10GbE; securitatea datelor prin criptare și decriptare în HDFS și controlul accesului pe bază de roluri cu granularitatea la nivel de celule în HBase; o performanță îmbunătățită a interogării Hive; suport pentru analiza statistică cu un conector pentru R, pachetul statistic popular sursă; și grafică analitică prin Intel Graph Builder. MapR

    : Pentru o distribuție completă pentru Apache Hadoop și proiectele aferente care sunt independente de Apache Software Foundation, nu căutați mai departe decât MapR. Nu are dependențe de Java sau se bazează pe sistemul de fișiere Linux, MapR este promovat ca singura distribuție Hadoop care oferă protecție completă a datelor, fără puncte de eșec și avantaje semnificative.

  • Sunt disponibile trei ediții MapR: M3, M5 și M7. Ediția M3 este gratuită și disponibilă pentru utilizare nelimitată în producție; MapR M5 este o ofertă de software de abonament la nivel intermediar; și MapR M7 este o distribuție completă pentru Apache Hadoop și HBase care include Pig, Hive, Sqoop și multe altele.

  • Comparând Hadoop Distributions - dummies

    Alegerea editorilor

    Administrator de rețea: Zone de căutare inversă - dummies

    Administrator de rețea: Zone de căutare inversă - dummies

    Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

    Rețea Elemente de bază: Clienți și servere - manechine

    Rețea Elemente de bază: Clienți și servere - manechine

    Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

    Retea Bazele: Poduri - dummies

    Retea Bazele: Poduri - dummies

    O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

    Alegerea editorilor

    ÎMprumuta și tweak idei de la alte comunități online - dummies

    ÎMprumuta și tweak idei de la alte comunități online - dummies

    , Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

    Branding Blogul tău

    Branding Blogul tău

    Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

    Construiți un Blog Mama care este Sellable - dummies

    Construiți un Blog Mama care este Sellable - dummies

    Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

    Alegerea editorilor

    Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

    Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

    LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

    Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

    Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

    Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

    Oferind și primind viziuni pe LinkedIn - manechine

    Oferind și primind viziuni pe LinkedIn - manechine

    Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...