Video: Etica Big Data în cercetare 2024
Veți găsi o nuanță despre analiza datelor importante. Este vorba despre date mici. Deși acest lucru poate părea confuz și în contradicție cu întreaga premisă, datele mici sunt produsul unei analize de date. Acesta nu este un concept nou, nici nu este familiar cu oamenii care au făcut analiza datelor pentru orice perioadă de timp. Spațiul general de lucru este mai mare, dar răspunsurile se află undeva în "micul. "
Analiza datelor tradiționale a început cu baze de date completate cu informații despre clienți, informații despre produse, tranzacții, date de telemetrie și așa mai departe. Chiar și atunci, au fost disponibile prea multe date pentru a analiza eficient. Sistemele, rețelele și software-ul nu au avut performanța sau capacitatea de a aborda scara. Ca industrie, deficiențele au fost abordate prin crearea de seturi de date mai mici.
Aceste seturi de date mai mici erau încă destul de importante, alte neajunsuri au fost descoperite rapid; cea mai evidentă a fost neconcordanța dintre date și contextul de lucru. Dacă ați lucrat în Conturi de plată, a trebuit să vă uitați la o cantitate mare de date independente pentru a vă face treaba. Din nou, industria a răspuns prin crearea unor seturi de date mai mici, relevante din punct de vedere contextual - mari, mici până la mici.
Este posibil să recunoașteți acest lucru ca migrarea de la baze de date la depozite de date la martor de date. De cele mai multe ori, datele pentru depozite și marts au fost alese pe parametrii arbitrari sau experimentali, ceea ce a condus la o mulțime de încercări și erori. Întreprinderile nu beneficiau de perspectivele pe care le aveau sau care erau posibile deoarece reducerile de capacitate nu se bazau pe fapte computaționale.
Introduceți date mari, cu toate volumele, vitezele și soiurile, iar problema rămâne sau poate se înrăutățește. Deficiențele infrastructurii au fost abordate și pot stoca și procesa cantități uriașe de date suplimentare, însă au fost necesare noi tehnologii, în special pentru a ajuta la gestionarea datelor importante.
În ciuda aparițiilor exterioare, acesta este un lucru minunat. Astăzi și în viitor, companiile vor avea mai multe date decât își pot imagina și vor avea mijloacele necesare pentru a le capta și a le gestiona. Ceea ce este mai necesar decât oricând este capacitatea de a analiza datele dreapta în timp suficient pentru a lua decizii și a lua măsuri.
Companiile vor continua să scadă seturile de date în "lupta de tăiere", dar pot face acest lucru computațional. Ei procesează datele mari și transformă-o în date mici, astfel încât să fie mai ușor de înțeles. Este mai precis și, deoarece a derivat dintr-un punct de plecare mult mai amplu, este mai relevant din punct de vedere contextual.