Acasă Finanțe personale Configurați mediul Hadoop cu Apache Bigtop - dummies

Configurați mediul Hadoop cu Apache Bigtop - dummies

Cuprins:

Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024

Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024
Anonim

Dacă sunteți confortabil să lucrați cu VM și Linux, aveți grijă să instalați Bigtop pe un alt VM decât ceea ce este recomandat. Dacă sunteți cu adevărat îndrăzneț și aveți hardware-ul, mergeți mai departe și încercați să instalați Bigtop pe un grup de mașini în mod complet distribuit!

Pasul 1: Descărcarea unui VM

Hadoop rulează pe toate distribuțiile Linux populare, deci aveți nevoie de un Linux VM. Există o imagine liberă (și legală!) CentOS 6 disponibilă.

Veți avea nevoie de un sistem de operare pe 64 de biți pe laptop pentru a rula acest VM. Hadoop are nevoie de un mediu pe 64 de biți.

După ce ați descărcat VM, extrageți-l din fișierul Zip descărcat în directorul destinație. Asigurați-vă că aveți aproximativ 50GB de spațiu disponibil ca Hadoop și datele dvs. de probă vor avea nevoie de el.

Dacă nu aveți deja un player VM, puteți descărca unul gratuit.

După ce ați instalat playerul VM, deschideți playerul, mergeți la File → Open, apoi mergeți la directorul unde ați extras Linux VM. Căutați un fișier numit și selectați-l. Veți vedea informații despre numărul de procesoare și cantitatea de memorie pe care o va utiliza. Aflați cât de mult are memoria calculatorului dvs. și alocați jumătate din acesta pentru a putea utiliza VM. Hadoop are nevoie de o mulțime de memorie.

Odată ce sunteți gata, faceți clic pe butonul Redare și instanța dvs. Linux va porni. Veți vedea o mulțime de mesaje zboară ca Linux este bootarea și veți ajunge la un ecran de login. Numele de utilizator este deja setat la "Tom. "Specificați parola ca" tomtom "și conectați-vă.

Pasul 2: Descărcarea Bigtop

Din interiorul Linux VM, faceți clic dreapta pe ecran și selectați Open in Terminal din meniul contextual care apare. Aceasta deschide un terminal Linux, unde puteți rula comenzi. Faceți clic în interiorul terminalului astfel încât să puteți vedea cursorul care clipește și introduceți următoarea comandă: su -

Veți fi solicitat parola, așa că tastați "tomtom" ca și cum ați făcut mai devreme. Această comandă comută utilizatorul la root, care este contul principal pentru un computer Linux - veți avea nevoie de acest lucru pentru a instala Hadoop.

Cu accesul rădăcină (nu lăsați puterea să ajungă la cap), executați următoarea comandă:

wget -O / etc / yum. operațiuni repo. d / BigTop. repo 

// www. apache. org / dist / BigTop / bigtop-

0. 7. 0 / repo / centos6 / bigtop. repo

Comanda este în esență o solicitare web, care solicită un fișier specific în URL-ul pe care îl puteți vedea și îl scrie într-o anumită cale - în acest caz, acesta este /.

Pasul 3: Instalarea Bigtop

Geniile din spatele Linuxului au făcut viața destul de ușoară pentru persoanele care au nevoie să instaleze pachete mari de software cum ar fi Hadoop.Ce ați descărcat în ultimul pas nu a fost întregul pachet Bigtop și toate dependențele acestuia. A fost doar un fișier de depozitare (cu extensia), care spune unui program de instalare care pachete software sunt necesare pentru instalarea Bigtop.

Ca orice produs software mare, Hadoop are o mulțime de premise, dar nu trebuie să vă faceți griji. Un fișier bine conceput va indica orice dependență, iar programul de instalare este suficient de inteligent pentru a vedea dacă acestea lipsesc pe computerul dvs. și apoi să le descărcați și să le instalați.

Programul de instalare pe care îl folosiți aici se numește yum, pe care îl puteți vedea acum în acțiune:

yum install hadoop * mahout * oozie * hbase * hive * hue * pig * zookeeper *

alegerea și alegerea componentelor Hadoop pe care să le instalați. Există o serie de alte componente disponibile în Bigtop, dar acestea sunt singurele pe care le veți folosi aici. Deoarece VM este o instalare Linux proaspătă, veți avea nevoie de multe dependențe, deci va trebui să așteptați un pic.

Programul de instalare yum este destul de verbos, astfel încât să puteți viziona exact ceea ce este descărcat și instalat pentru a trece timpul. Când procesul de instalare este terminat, ar trebui să vedeți un mesaj care spune "Completați! "

Pasul 4: Pornirea Hadoop

Înainte de a începe să rulați aplicații pe Hadoop, există câteva setări de bază și setări de lucru pe care trebuie să le faceți. Aici sunt în ordine:

  1. Descărcați și instalați Java:

    yum install java-1. 7. 0-openjdk-devel. x86_64
    
  2. Formați numeleNode:

    sudo / etc / init. d / hadoop-hdfs-namenode init
    
  3. Porniți serviciile Hadoop pentru clusterul dvs. pseudodistribuit:

    pentru i în hadoop-hdfs-namenode hadoop-hdfs-datanode; face serviciul sudo $ i începe; făcut
    
  4. Creați o structură de sub-director în HDFS:

    sudo / usr / lib / hadoop / libexec / init-hdfs. sh
    
  5. Porniți daemonii YARN:

serviciul sudo hadoop-yarn-resourcemanager startudo service hadoop-yarn-nodemanager start

Și cu asta ați terminat. Felicitări! Ai instalat o implementare Hadoop de lucru!

Pasul 5: Descărcarea setului de date eșantion

Pentru a descărca setul de date eșantion, deschideți browserul Firefox din interiorul VM și accesați pagina de date expo.

Nu veți avea nevoie de întregul set de date, așa că începeți cu un singur an, 1987. Când sunteți pe punctul de a descărca, selectați opțiunea Open with Archive Manager.

După ce fișierul a fost descărcat, extrage fișierul în directorul de acasă unde îl vei găsi cu ușurință. Faceți clic pe butonul Extract, apoi selectați directorul Desktop.

Pasul 6: Copierea eșantionului de date în HDFS

Amintiți-vă că programele dvs. Hadoop pot funcționa numai cu date după ce sunt stocate în HDFS. Ceea ce veți face acum este să copiați fișierul de date de zbor pentru 1987 în HDFS. Introduceți următoarea comandă:

hdfs dfs -copyFromLocal 1987. csv / user / root
Configurați mediul Hadoop cu Apache Bigtop - dummies

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...