Cuprins:
- Elemente de bază importante: RDBMS și date persistente
- Bazele de date mari: RDBMS și tabele
- PostgreSQL, o bază de date relațională deschisă
Video: SQL Tutorial - Full course for beginners 2024
Datele mari devin un element important în modul în care organizațiile folosesc date de mare volum la viteza potrivită pentru a rezolva date specifice Probleme. Sistemele de gestionare a bazelor de date relaționale sunt importante pentru acest volum mare. Datele mari nu trăiesc în izolare. Pentru a fi eficiente, companiile trebuie adesea să poată combina rezultatele analizei mari a datelor cu datele existente în cadrul afacerii.
Elemente de bază importante: RDBMS și date persistente
Unul dintre cele mai importante servicii oferite de bazele de date operaționale (denumit și stocarea datelor ) este persistența. Persistența garantează că datele stocate într-o bază de date nu vor fi modificate fără permisiuni și că vor fi disponibile atâta timp cât sunt importante pentru companie. Ce bun este o bază de date în cazul în care nu poate fi de încredere pentru a proteja datele pe care le puneți în ea?
Având în vedere această cerință cea mai importantă, trebuie să vă gândiți apoi la ce fel de date doriți să persistați, la cum puteți să îl accesați și să îl actualizați și cum îl puteți utiliza pentru a lua decizii de afaceri. La acest nivel cel mai fundamental, alegerea motoarelor dvs. de baze de date este esențială pentru succesul dvs. general, cu implementarea mare a datelor.
Chiar dacă tehnologia de bază a fost în jur de ceva timp, multe dintre aceste sisteme funcționează astăzi, deoarece afacerile pe care le suportă depind în mare măsură de date. Pentru a le înlocui ar fi similar cu schimbarea motoarelor unui avion pe un zbor transoceanic.
Bazele de date mari: RDBMS și tabele
Bazele de date relaționale sunt construite pe una sau mai multe relații și sunt reprezentate prin tabele. Aceste tabele sunt definite prin coloanele lor, iar datele sunt stocate în rânduri. Cheia primară este adesea prima coloană din tabel. Coerența bazei de date și o mare parte a valorii acesteia sunt obținute prin "normalizarea" datelor. Datele standardizate au fost convertite din format nativ într-un format comun, convenit.
De exemplu, într-o singură bază de date puteți avea "telefon" ca XXX-XXX-XXXX, în timp ce în alta ar putea fi XXXXXXXXX. Pentru a obține o vizualizare consecventă a informațiilor, câmpul va trebui să fie normalizat într-o altă formă. Există cinci niveluri de standarde pentru normalizare. Alegerea formei normale este adesea retrogradată la proiectantul bazei de date. Colecția de tabele, chei, elemente și așa mai departe este cunoscută sub denumirea de schemă de bază de date .
De-a lungul anilor, limba de interogare structurată (SQL) a evoluat în pasul de blocare cu tehnologia RDBMS și este mecanismul cel mai utilizat pentru crearea, interogarea, întreținerea și operarea bazelor de date relaționale.
În companiile mici și mari, majoritatea informațiilor lor operaționale importante sunt probabil stocate în RDBMS. Multe companii au RDBMS diferite pentru diferite domenii ale activității lor. Datele tranzacționale ar putea fi stocate în baza de date a unui furnizor, în timp ce informațiile despre clienți ar putea fi stocate în altul.
Este puțin probabil să utilizați RDBMS pentru nucleul implementării, dar va trebui să vă bazați pe datele stocate în RDBMS pentru a crea cel mai înalt nivel de valoare pentru afacerea cu date mari.
PostgreSQL, o bază de date relațională deschisă
În timpul implementării mari a datelor, veți întâlni probabil PostgreSQL, o bază de date relațională larg răspândită. Mai mulți factori contribuie la popularitatea PostgreSQL. Ca RDBMS cu suport pentru standardul SQL, face toate lucrurile asteptate intr-un produs baze de date, plus longevitatea si utilizarea larga au facut-o "testata lupta. "Este disponibil și pentru aproape orice varietate de sisteme de operare, de la PC la mainframe.
Furnizarea elementelor de bază și realizarea acestora în mod fiabil sunt doar o parte a povestirii. PostgreSQL suportă, de asemenea, multe caracteristici care se găsesc numai în RDBMS-uri costisitoare, inclusiv următoarele:
-
Capabilitatea de a gestiona direct "obiectele" în schema relațională
-
Cheile străine (cheile de referință de la un tabel la altul)
-
Triggers folosit pentru a porni automat o procedură stocată)
-
Interogări complexe (subunități și legături între tabele discrete)
-
Integritatea tranzacțională
-
Controlul concurenței multiversiune
Puterea reală a PostgreSQL este extensibilitatea acesteia. Utilizatorii și programatorii bazei de date pot adăuga noi capabilități fără a afecta funcționarea sau fiabilitatea fundamentală a bazei de date. Extensiile posibile includ
-
Tipuri de date
-
Operatori
-
Funcții
-
Metode de indexare
-
Limbi de procedură
Acest nivel ridicat de personalizare face ca PostgreSQL să fie de dorit atunci când produsele rigide nu vor reuși. Este infinit de extensibil.
În cele din urmă, licența PostgreSQL permite modificarea și distribuirea în orice formă, sursă deschisă sau închisă. Orice modificări pot fi păstrate private sau împărtășite cu comunitatea așa cum doriți.