Video: Building data pipelines for Modern Data Warehouse with Spark and .NET in Azure - BRK3055 2024
Un depozit de date este, prin însăși natura sa, un depozit de date fizice distribuite. Distribuția activelor dvs. de informații contribuie la performanța și la utilizarea în toate sistemele și întreaga întreprindere. Faceți acest nivel de utilitate piatra de temelie a misiunii și obiectivului dvs. de depozitare a datelor.
Această figură arată modul în care stocările de date importante ale unei arhitecturi de stocare de date includ surse de date, depozitul de date, un depozit de date operațional, date martor și date de bază.
Fluxurile de date sursă sunt intrările care alimentează depozitul de date - de obicei, bazele de date ale aplicațiilor de tip "run-the-business", precum și sursele externe de date, cum ar fi datele de rating de credit sau informațiile despre segmentul de piață. Deși echipa de depozitare a datelor nu gestionează datele și arhitectura asociată acestor stocări de date, echipa trebuie să înțeleagă fluxurile de date.
La fel ca un cal fără copite nu poate funcționa corect, un depozit de date fără surse nu poate face treaba. Cea mai dificilă sarcină cu care vă confruntați în depozitarea datelor este alegerea sursei potrivite sau a sistemului de înregistrare pentru datele care se mută în depozitul de date. Dacă datele sunt de calitate scăzută sau nu sunt disponibile imediat, aveți un timp dificil de sprijinire a unui depozit de date de înaltă calitate.