Cuprins:
- Hipervizorul mare de date
- Abstracția și virtualizarea datelor
- Implementați virtualizarea pentru a lucra cu date mari
Video: Solutii convergente pentru centre de date 2024
Virtualizarea separă resursele și serviciile de cele care stau la baza mediul de livrare fizic, permițându-vă să creați multe sisteme virtuale într-un singur sistem fizic. Unul dintre motivele principale pe care companiile le-au implementat pentru virtualizare este acela de a îmbunătăți performanța și eficiența procesării unui amestec divers de volume de lucru
Hipervizorul mare de date
Într-o lume ideală, nu vreți să vă faceți griji cu privire la starea de bază sistemul de operare și hardware-ul fizic. Un hypervisor este tehnologia responsabilă de asigurarea faptului că schimbul de resurse are loc într-un mod ordonat și repetabil.
Hipervizorul se află la cele mai joase niveluri ale mediului hardware și utilizează un strat subțire de cod pentru a permite schimbul de resurse dinamice. Hipervizorul face ca fiecare sistem de operare să aibă toate resursele fizice pentru sine.
În lumea datelor importante, este posibil să aveți nevoie de suport pentru multe medii de operare diferite. Hipervisorul devine un mecanism de livrare ideal pentru componentele tehnologice ale stivei mari de date. Hipervizorul vă permite să afișați aceeași aplicație pe o mulțime de sisteme fără a fi nevoie să copiați fizic acea aplicație pe fiecare sistem.
Ca un avantaj suplimentar, datorită arhitecturii hypervisor, poate încărca sisteme de operare diferite ca și cum ar fi fost doar o altă aplicație. Deci, hypervisor este o modalitate foarte practica de a obtine lucrurile virtualizate rapid si eficient.
Sistemele de operare oaspete sunt sistemele de operare care rulează pe mașinile virtuale. Cu ajutorul tehnologiei de virtualizare, puteți configura hypervisor să împartă resursele fizice ale computerului. Resursele pot fi împărțite 50/50 sau 80/20 între două sisteme de operare, de exemplu.
Frumusețea acestui aranjament este că hypervisorul face toată ridicarea greu. Sistemul de operare gazdă nu are grijă să ruleze într-o partiție virtuală; se gândește că are un computer tot la el însuși.
În principiu, găsiți două tipuri de hypervisoare:
-
Hipervisorii de tip 1 rulează direct pe platforma hardware. Ei obțin o eficiență mai mare, deoarece aceștia rulează direct pe platformă.
-
Hipervizorii de tip 2 rulează pe sistemul de operare gazdă. Acestea sunt adesea folosite atunci când există o nevoie de a sprijini o gamă largă de dispozitive I / O.
Abstracția și virtualizarea datelor
Pentru resursele și serviciile IT care urmează a fi virtualizate, acestea sunt separate de mediul de livrare fizic subiacent.Termenul pentru acest act de separare este numit abstractizare. Abstracția este un concept cheie în datele mari. MapReduce și Hadoop sunt medii de calcul distribuite unde totul este extras. Detaliile sunt extrase astfel încât dezvoltatorul sau analistul nu trebuie să se preocupe de locul în care sunt localizate elementele de date.
Abstractizarea minimizează complexitatea ceva prin ascunderea detaliilor și furnizarea numai a informațiilor relevante. De exemplu, dacă ați lua pe cineva pe care nu l-ați mai întâlnit niciodată, ar putea să vă spună locația pentru a se întâlni cu el și ce va purta. Nu are nevoie să-ți spună unde sa născut, cât de mulți bani are în bancă, data nașterii și așa mai departe.
Aceasta este ideea cu abstractizarea - este vorba despre furnizarea unei specificații la nivel înalt, mai degrabă decât despre o detaliere detaliată despre cum funcționează ceva.
Implementați virtualizarea pentru a lucra cu date mari
Virtualizarea vă ajută să faceți din mediul dvs. IT suficient de inteligent pentru a gestiona analiza datelor. Optimizând toate elementele infrastructurii, inclusiv hardware, software și spațiu de stocare, obțineți eficiența necesară procesării și gestionării volumelor mari de date structurate și nestructurate. Cu date mari, trebuie să accesați, să gestionați și să analizați date structurate și nestructurate într-un mediu distribuit.
Datele mari presupun distribuția. În practică, orice tip de MapReduce va funcționa mai bine într-un mediu virtualizat. Aveți nevoie de capacitatea de a muta încărcările de lucru pe baza cerințelor de calcul și de stocare.
Virtualizarea vă va permite să abordați problemele mai mari care nu au fost încă abordate. S-ar putea să nu știți în avans cât de repede va trebui să scalați.
Virtualizarea vă va permite să sprijiniți o varietate de magazine operaționale mari de date. De exemplu, o bază de date cu grafice poate fi rotită ca o imagine.
Beneficiul cel mai direct din virtualizare este să se asigure că motoarele MapReduce funcționează mai bine. Virtualizarea va avea ca rezultat o scară și o performanță mai bună pentru MapReduce. Fiecare dintre sarcinile Map și Reduce trebuie executată independent. Dacă motorul MapReduce este paralealizat și configurat să funcționeze într-un mediu virtual, puteți reduce cheltuielile de gestiune și permite extinderi și contracții în sarcinile de lucru ale task-ului.
MapReduce în sine este în mod paralel și distribuit. Prin încapsularea motorului MapReduce într-un container virtual, puteți executa ceea ce aveți nevoie ori de câte ori aveți nevoie. Cu ajutorul virtualizării, vă creșteți utilizarea bunurilor pe care le-ați plătit deja, transformându-le în resurse generice.