Acasă Finanțe personale Importanța MapReduce în Hadoop - manechine

Importanța MapReduce în Hadoop - manechine

Video: Hadoop Fundamentals: Understanding the MapReduce Paradigm 2024

Video: Hadoop Fundamentals: Understanding the MapReduce Paradigm 2024
Anonim

Pentru cea mai mare parte a istoriei lui Hadoop, MapReduce a fost singurul joc din oraș când vine vorba de prelucrarea datelor. Disponibilitatea MapReduce a fost motivul succesului lui Hadoop și, în același timp, un factor major în limitarea adoptării ulterioare.

MapReduce permite programatorilor calificați să scrie aplicații distribuite fără a fi nevoiți să vă faceți griji cu privire la infrastructura distribuită de calcul distribuită. Aceasta este o afacere foarte mare: Hadoop și cadrul MapReduce se ocupă de tot felul de complexități pe care dezvoltatorii de aplicații nu trebuie să le facă față.

De exemplu, capacitatea de a extinde în mod transparent clusterul prin adăugarea de noduri și de failover automat atât a subsistemelor de stocare a datelor, cât și a proceselor de prelucrare a datelor are loc cu impact zero asupra aplicațiilor.

Cealaltă parte a monedei este că, deși MapReduce ascunde o cantitate enormă de complexitate, nu vă puteți permite să uitați ce este: o interfață pentru programare paralelă. Aceasta este o abilitate avansată - și o barieră pentru o adoptare mai largă. Pur și simplu nu există încă mulți programatori MapReduce, și nu toată lumea are abilitatea de ao stăpâni.

În primele zile ale lui Hadoop (Hadoop 1 și înainte), ai putea rula aplicații MapReduce numai pe clustere. În Hadoop 2, componenta YARN a schimbat toate acestea prin preluarea gestionării și planificării resurselor din cadrul MapReduce și oferind o interfață generică pentru a facilita aplicațiile să ruleze pe un cluster Hadoop.

Pe scurt, aceasta înseamnă că MapReduce este acum doar unul dintre multele cadre de aplicații pe care le puteți utiliza pentru a dezvolta și a rula aplicații pe Hadoop. Deși este cu siguranță posibil să rulați aplicații utilizând alte cadre pe Hadoop, aceasta nu înseamnă că putem începe să uităm de MapReduce.

MapReduce este în prezent singurul cadru de procesare a datelor disponibil pentru Hadoop. Deși alte cadre vor deveni disponibile în cele din urmă, MapReduce are aproape o decadă de maturitate sub centură (cu aproape 4 000 de probleme JIRA finalizate, implicând sute de dezvoltatori, dacă țineți evidența).

Nu există nici o dispută: MapReduce este cel mai matur cadru al Hadoop pentru prelucrarea datelor. În plus, o cantitate semnificativă de cod MapReduce este acum în uz, ceea ce este puțin probabil să meargă oriunde în curând. Povestea scurtă: MapReduce este o parte importantă a povestirii lui Hadoop.

Proiectele Apache Hive și Apache Pig sunt foarte populare deoarece sunt mai ușor de intrare în procesarea datelor pe Hadoop. Pentru multe probleme, în special tipurile pe care le puteți rezolva cu SQL, stupul și porcul sunt instrumente excelente.Dar pentru o sarcină mai largă, cum ar fi prelucrarea statistică sau extragerea textului și mai ales pentru prelucrarea datelor nestructurate, trebuie să utilizați MapReduce.

Importanța MapReduce în Hadoop - manechine

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...