Video: Calculation Model (lite version) for Global Management Challenge 2024
Un depozit de date este o abordare fără brioșe, oase goale și cu tehnologie mică pentru a furniza date care pot ajuta cu unele procesul de luare a deciziilor în afaceri. No-brills înseamnă că puneți împreună, ori de câte ori este posibil, capabilități și instrumente dovedite deja în cadrul organizației dvs. pentru a vă construi sistemul.
Domeniile tematice și conținutul datelor dintr-un depozit de date litere
Un depozit de date este axat pe raportarea sau analizarea unei singure sau eventual două domenii. Să presupunem că în activitatea dvs. la o divizie fără fir a unei companii de telefonie, analizați vânzările de servicii cum ar fi minute în rețea, minute în afara rețelei, mesaje text, acces la Internet și alte utilizări mobile către gospodăriile consumatorilor.
Dacă construiți un depozit de date exclusiv în acest scop, aveți toate informațiile necesare pentru a vă susține analiza și raportarea pentru piața de consum. Cu toate acestea, nu aveți nicio informație despre utilizatorii de afaceri și despre istoricul plăților, deoarece aceste informații fac parte dintr-o zonă diferită, așa cum se arată în această figură.
Pe baza limitării domeniului de date, un depozit de date de date are suficient conținut suficient pentru a satisface scopul principal al mediului, dar nu este suficient pentru multe scenarii care ar putea fi create de utilizatori.
Prin urmare, trebuie să alegeți cu atenție din rândul tuturor elementelor posibile de date și să selectați un subgrup gestionabil - elemente care, fără îndoială, sunt importante. Acest proces este același pentru orice implementare a depozitului de date, cu excepția faptului că trebuie să fiți extrem de disciplinat când luați decizii cu privire la ce conținut să includeți.
Utilizați rapoarte standard, în special cele care necesită în prezent o mare pregătire manuală, ca fiind unul dintre ghidurile principale de determinare a conținutului datelor dintr-un depozit de date.
Surse de date
Un depozit de date are un set limitat de surse de date - de obicei unul până la o mână. Ca parte a unui mediu global cu o singură aplicație, de exemplu, depozitul de date acționează ca agent de restructurare pentru datele aplicației, pentru a-l face mai prietenos cu interogările și rapoartele.
Cele mai comune metode de restructurare a datelor unei singure aplicații sunt denormalizarea conținutului tabelelor de baze de date relaționale ale aplicației pentru a elimina cât mai multe operații de relaționare (procesul de reunire a datelor din mai multe tabele de baze de date), atunci când utilizatorii execută rapoarte sau fac interogări simple.
Denormalizarea este opusul conceptului de bază de date relațională a normalizării, un set oarecum complex de linii directoare care vă spune care elemente de date ar trebui să fie în tabelele dintr-o bază de date.
Când denormalizați o bază de date, nu vă faceți griji cu privire la datele duplicate; încercați să creați rânduri de date într-un singur tabel care, cel mai probabil, reflectă rapoartele și interogările pe care le rulează utilizatorii. Această figură arată un exemplu de stocare de date dintr-o singură sursă construită pe denormalizare.
Deși puteți utiliza datele furnizate extern într-o implementare a depozitului de date, datele pe care le utilizați sunt rareori achiziționate recent. Este mai probabil să includeți date pe care le utilizați deja pentru analiză (probabil într-o manieră autonomă).
Instrumentele de business intelligence
Utilizatorii unui depozit de date de obicei pun întrebări și creează rapoarte care reflectă perspectiva "Spune-mi ce sa întâmplat". Întrucât acești utilizatori nu fac mult prelucrare analitică, produsele pe care le utilizează pentru a accesa depozitul de date ar trebui să fie ușor de utilizat.
Extragerea, mișcarea și încărcarea datelor
Simplitatea este numele jocului într-un depozit de date. Prin urmare, efectuați procesul de extragere a datelor din surse și efectuarea tuturor funcțiilor necesare pentru pregătirea acelor date pentru încărcarea cât mai direct posibil prin utilizarea acestor două elemente:
-
Extracte simple de fișiere din sistemele run-the-business și transferurile de fișiere care vă permite să mutați datele din sursele sale în depozitul de date lite
-
Codul personalizat direct (sau poate un instrument ușor de utilizat) care poate extrage și muta date
Dacă sursa de date pentru depozitul de date este Lite bazat pe o bază de date relațională și intenționați să utilizați același produs de bază de date pentru depozitul de date, utilizați SQL pentru a gestiona cu ușurință extragerea și mișcarea datelor. Acești pași - așa cum se arată în figură - oferă o procedură standard pentru acest proces (veți dori să adaptați acești pași către mediul dvs., desigur):
-
În sistemul care vă găzduiește depozitul, utilizați tabela SQL CREATE TABLE pentru a crea definiția pentru fiecare tabel din depozitul de date.
-
Creați o bază de date de rezervă care conține copii ale tuturor tabelelor din sursa care furnizează date depozitului și apoi reîncărcați tabelele într-o zonă de așteptare a sistemului în care intenționați să localizați depozitul de date.
Trebuie să vă asigurați că lățimea de bandă a rețelei și fereastra de timp sunt adecvate pentru a copia toate tabelele sursă în sistem utilizând un program de transfer de fișiere.
-
Utilizați instrucțiunea SQL INSERT, cu o instrucțiune SELECT imbricată specificând tabelele sursă și coloanele respective care vor popula tabela de depozit de date (și modul în care tabelele vor fi îmbinate), pentru a încărca datele în depozitul de date.
-
Rulați o serie de rutine de asigurare a calității (QA) pentru a verifica dacă toate datele au fost încărcate corect.
Verificați numărarea rândului, totalul numeric și orice altceva puteți.
Arhitectura
Arhitectura unui depozit de date este compusa din baza de date utilizata pentru stocarea datelor, instrumentele de informatii de business folosite pentru a accesa datele, modalitatea de mutare a datelor si numarul de subiecte zone.Cuvântul de cuvânt al acestui mediu este minimalist: fără clopote, fără fluiere, nimic fantezist - tehnologia suficientă aplicată mediului înconjurător pentru a oferi utilizatorilor acces la datele de care au nevoie.
Arhitectura unui depozit de date, așa cum se arată în această figură, conține aceste tipuri majore de componente:
-
O bază de date unică conține datele depozitului.
-
Această bază de date este alimentată direct de la fiecare sursă care furnizează date depozitului.
-
Utilizatorii accesează datele direct din depozit.