Acasă Finanțe personale Care rulează Aplicații Înainte de Hadoop 2 - dummies

Care rulează Aplicații Înainte de Hadoop 2 - dummies

Video: Technology Stacks - Computer Science for Business Leaders 2016 2024

Video: Technology Stacks - Computer Science for Business Leaders 2016 2024
Anonim

Deoarece multe dintre implementările Hadoop existente încă nu utilizează încă un alt negociator de resurse (YARN), aruncăm o privire rapidă asupra modului în care Hadoop a gestionat prelucrarea datelor înainte de zile din Hadoop 2. Concentrați-vă pe rolul pe care demnitarul master JobTracker și daemonii slave TaskTracker au jucat în procesarea procesării MapReduce.

Întregul punct de utilizare a sistemelor distribuite este să poată implementa resursele de calcul într-o rețea de computere autonome într-un mod care să fie tolerant la greșeli, ușor și ieftin.

Într-un sistem distribuit, cum ar fi Hadoop, unde aveți un grup de noduri computerizate care lucrează în paralel, o mare complexitate are rolul de a asigura că toate piesele lucrează împreună. Ca atare, aceste sisteme au, în mod obișnuit, straturi distincte pentru a gestiona sarcini diferite pentru a sprijini procesarea paralelă a datelor.

Acest concept, cunoscut sub numele de separarea preocupărilor, asigură că, dacă sunteți, de exemplu, programatorul de aplicații, nu trebuie să vă faceți griji cu privire la detaliile specifice, de exemplu, sarcinile de hartă. În Hadoop, sistemul constă din aceste patru straturi distincte, așa cum se arată:

  • Sistemul distribuit de fișiere Hadoop (HDFS) este stratul de stocare în care sunt stocate seturile de date, rezultate intermediare și rezultate finale. Gestionarea resurselor:

  • În plus față de spațiul de pe disc, toate nodurile slave din clusterul Hadoop au cicluri CPU, RAM și lățime de bandă a rețelei. Un sistem cum ar fi Hadoop trebuie să fie capabil să distribuie aceste resurse, astfel încât aplicațiile și utilizatorii multipli să poată partaja clusterul în moduri previzibile și reglabile. Această activitate este făcută de daemonul JobTracker.

    Cadrul de procesare:
  • Debitul procesului MapReduce definește execuția tuturor aplicațiilor în Hadoop 1. Aceasta începe cu faza de hartă; continuă cu agregare cu amestecare, sortare sau îmbinare; și se termină cu faza de reducere. În Hadoop 1, acest lucru este de asemenea gestionat de daemonul JobTracker, execuția locală fiind gestionată de daemonii TaskTracker care rulează pe nodurile slave. Interfața de programare a aplicațiilor (API):

  • Aplicațiile dezvoltate pentru Hadoop 1 trebuie să fie codificate folosind API-ul MapReduce. În Hadoop 1, proiectele Hive and Pig oferă programatorilor interfețe mai ușoare pentru scrierea aplicațiilor Hadoop, iar sub hota, codul lor se compilează până la MapReduce. În lumea lui Hadoop 1 (care a fost singura lume pe care ai avut-o până curând), toate prelucrările de date se învârteau în jurul MapReduce.

  • Care rulează Aplicații Înainte de Hadoop 2 - dummies

    Alegerea editorilor

    Administrator de rețea: Zone de căutare inversă - dummies

    Administrator de rețea: Zone de căutare inversă - dummies

    Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

    Rețea Elemente de bază: Clienți și servere - manechine

    Rețea Elemente de bază: Clienți și servere - manechine

    Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

    Retea Bazele: Poduri - dummies

    Retea Bazele: Poduri - dummies

    O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

    Alegerea editorilor

    ÎMprumuta și tweak idei de la alte comunități online - dummies

    ÎMprumuta și tweak idei de la alte comunități online - dummies

    , Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

    Branding Blogul tău

    Branding Blogul tău

    Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

    Construiți un Blog Mama care este Sellable - dummies

    Construiți un Blog Mama care este Sellable - dummies

    Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

    Alegerea editorilor

    Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

    Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

    LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

    Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

    Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

    Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

    Oferind și primind viziuni pe LinkedIn - manechine

    Oferind și primind viziuni pe LinkedIn - manechine

    Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...