Acasă Finanțe personale Cum se asigură validitatea, veridicitatea și volatilitatea datelor mari

Cum se asigură validitatea, veridicitatea și volatilitatea datelor mari

Cuprins:

Video: Cum ați verifici asigurarea RCA pe internet din (uk) și romania 2024

Video: Cum ați verifici asigurarea RCA pe internet din (uk) și romania 2024
Anonim

Volumul mare, varietatea mare și viteza mare sunt caracteristicile esențiale ale Date mare. Dar alte caracteristici ale datelor mari sunt la fel de importante, mai ales când aplicați date importante proceselor operaționale. Acest al doilea set de caracteristici "V" care sunt esențiale pentru operarea datelor mari include

  • Valabilitate: Sunt datele corecte și exacte pentru utilizarea dorită?

  • Veracitate: Sunt rezultatele semnificative pentru spațiul de probleme dat?

  • Volatilitate: Cât timp trebuie să stocați aceste date?

Valabilitate mare a datelor

Vrei rezultate precise. Dar, în stadiile inițiale de analiză a câtorva intervale de date, este posibil să nu vă îngrijorați de cât de valabil este fiecare element de date. Acest flux inițial de date mari ar putea fi destul de murdar. În etapele inițiale, este mai important să vedem dacă există relații între elementele din această sursă de date masivă decât să se asigure că toate elementele sunt valide.

Totuși, după ce o organizație stabilește că anumite părți din analiza inițială a datelor sunt importante, această submulțime de date importante trebuie validată deoarece va fi aplicată acum unei condiții operaționale. Atunci când datele se mută de la explorator la acțiuni, datele trebuie validate. Valabilitatea surselor mari de date și analiza ulterioară trebuie să fie corecte dacă doriți să utilizați rezultatele pentru luarea deciziilor.

Datele de intrare valide urmate de prelucrarea corectă a datelor ar trebui să obțină rezultate precise. Cu date mari, trebuie să fiți vigilenți în ceea ce privește valabilitatea. De exemplu, în domeniul asistenței medicale, este posibil să aveți date dintr-un studiu clinic care ar putea fi legate de simptomele bolii unui pacient. Dar un medic care tratează această persoană nu poate pur și simplu să ia rezultatele studiului clinic ca fără a le valida.

Imaginați-vă că satelitul meteorologic indică faptul că o furtună începe într-o parte a lumii. Cum este acea furtună care afectează indivizii? Cu aproximativ jumătate de miliard de utilizatori, este posibil să se analizeze fluxurile Twitter pentru a determina impactul unei furtuni asupra populațiilor locale. Prin urmare, utilizarea Twitter în combinație cu date de la un satelit meteorologic ar putea ajuta cercetătorii să înțeleagă veridicitatea unei previziuni meteorologice.

Viteza mare a datelor

Dacă aveți date valide și puteți dovedi veridicitatea rezultatelor, cât timp trebuie să "trăiască" datele pentru a vă satisface nevoile? Într-o setare standard de date, puteți păstra datele de zeci de ani, deoarece în timp ați construit o înțelegere a datelor importante pentru ceea ce faceți cu acestea.Ați stabilit reguli pentru valută și disponibilitate de date care să corespundă proceselor dvs. de lucru.

De exemplu, unele organizații ar putea să păstreze cel mai recent an de date despre clienți și tranzacții în sistemele lor de afaceri. Aceasta va asigura recuperarea rapidă a acestor informații atunci când este necesar. Dacă trebuie să se uite la un an anterior, echipa IT ar putea avea nevoie să restaureze datele din spațiul de stocare offline pentru a onora cererea. Cu date mari, această problemă este amplificată.

Dacă stocarea este limitată, uitați-vă la sursele de date mari pentru a determina ce trebuie să obțineți și cât timp trebuie să-l păstrați. În cazul unor surse de date mari, este posibil să fiți nevoiți să colectați date pentru o analiză rapidă.

Puteți apoi să stocați informațiile la nivel local pentru o prelucrare ulterioară. Dacă nu aveți suficient spațiu de stocare pentru toate aceste date, puteți procesa datele "în zbor" și păstrați doar informații relevante la nivel local. Cât timp țineți datele importante disponibile depinde de câțiva factori:

  • Cât de mult se păstrează datele la sursă?

  • Trebuie să procesați datele în mod repetat?

  • Trebuie să procesați datele, să adunați date suplimentare și să efectuați mai multe procesări?

  • Aveți reguli sau reglementări care necesită stocarea datelor?

  • Clienții dvs. depind de datele dvs. pentru munca lor?

  • Datele au valoare sau nu mai sunt relevante?

Datorită volumului, varietății și vitezei datelor mari, trebuie să înțelegeți volatilitatea. Pentru unele surse, datele vor fi întotdeauna acolo; pentru alții, acest lucru nu este cazul. Înțelegerea datelor care sunt acolo și pentru cât timp vă pot ajuta să definiți cerințele de păstrare și politicile privind datele importante.

În calitate de consumator, datele importante vor contribui la definirea unui profil mai bun pentru cum și când achiziționați bunuri și servicii. Ca pacient, datele importante vor ajuta la definirea unei abordări mai personalizate a tratamentelor și a menținerii sănătății. Ca profesionist, datele importante vă vor ajuta să identificați modalități mai bune de proiectare și livrare a produselor și serviciilor dvs.

Acest lucru se va întâmpla numai atunci când datele importante sunt integrate în procesele de operare ale companiilor și organizațiilor.

Cum se asigură validitatea, veridicitatea și volatilitatea datelor mari

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...