Slave Node and Disk Failures în HDFS - dummy

Video: Despre Paște și importanța lui în evoluția spirituală (cu subtitrare) 2024

Ca și morțile și impozitele, eșecurile discurilor (și datând suficient timp, chiar și eșecurile nodurilor sau rack-urilor) inevitabil în Sistemul de fișiere distribuite Hadoop (HDFS). În exemplul prezentat, chiar dacă un rack ar eșua, clusterul ar putea continua să funcționeze. Performanța ar fi afectată deoarece ați pierdut jumătate din resursele dvs. de procesare, dar sistemul este încă online și toate datele sunt încă disponibile.

Într-un scenariu în care o unitate de disc sau un uz slave eșuează, serverul central pentru metadate pentru HDFS (numit NameNode) aflate în cele din urmă că blocurile de fișiere stocate pe resursa eșuată nu mai sunt disponibile. De exemplu, dacă Slave Node 3 nu reușește, ar însemna că blocurile A, C și D sunt subreplicate .

Cu alte cuvinte, prea puține copii ale acestor blocuri sunt disponibile în HDFS. Când HDFS simte că un bloc este subreplicat, acesta comandă o nouă copie.

Pentru a continua exemplul, spuneți că Slave Node 3 revine online după câteva ore. Între timp, HDFS a asigurat existența a trei copii ale tuturor blocurilor de fișiere. Deci, acum, blocurile A, C și D au patru copii și sunt redirecționate . Ca și în cazul blocurilor subreplicate, serverul de metadate central HDFS va afla despre acest lucru și va ordona o copie a fiecărui fișier pentru a fi șters.

Un rezultat bun al disponibilității datelor este că, atunci când apar defecțiuni ale discurilor, nu este nevoie să înlocuiți imediat hard disk-urile defecte. Acest lucru se poate face mai eficient la intervale regulate.