Acasă Finanțe personale Fluxuri de date mari - dummies

Fluxuri de date mari - dummies

Video: PROGRESE MARI AU FOST FĂCUTE 2024

Video: PROGRESE MARI AU FOST FĂCUTE 2024
Anonim

Pentru a înțelege fluxurile de date mari, trebuie să înțelegeți ce este un proces și cum se raportează la fluxul de lucru în medii cu intensitate mare de date. Procesele au tendința de a fi proiectate ca structuri de nivel înalt, end-to-end, utile pentru luarea deciziilor și normalizarea modului în care se realizează lucrurile într-o companie sau organizație.

În schimb, fluxurile de lucru sunt orientate spre sarcini și necesită adesea date mai specifice decât procesele. Procesele sunt compuse dintr-unul sau mai multe fluxuri de lucru relevante pentru obiectivul general al procesului.

În multe privințe, fluxurile de lucru mari de date sunt similare cu fluxurile de lucru standard. De fapt, în orice flux de lucru, datele sunt necesare în diferitele faze pentru a îndeplini sarcinile. Luați în considerare fluxul de lucru într-o situație de sănătate.

Un flux de lucru elementar este procesul de "extragere a sângelui. Desenarea sângelui este o sarcină necesară pentru a finaliza procesul general de diagnosticare. Dacă se întâmplă ceva și dacă sângele nu a fost atras sau datele din testul de sânge au fost pierdute, acesta va avea un impact direct asupra veridicității sau veridicității activității globale.

Ce se întâmplă atunci când introduceți un flux de lucru care depinde de o sursă mare de date? Deși s-ar putea să utilizați fluxurile de lucru existente, nu puteți presupune că un proces sau un flux de lucru va funcționa corect doar prin înlocuirea unei surse de date mari cu o sursă standard. Este posibil ca aceasta să nu funcționeze deoarece metodele standard de procesare a datelor nu au abordări sau performanță de procesare pentru a gestiona complexitatea datelor mari.

Exemplul de asistență medicală se concentrează asupra necesității de a efectua o analiză după ce sângele este extras de la pacient. În fluxul de date standard, sângele este tipărit și apoi anumite teste chimice sunt efectuate pe baza cerințelor medicului de îngrijire medicală.

Este puțin probabil ca acest flux de lucru să înțeleagă testarea necesară pentru identificarea biomarkerilor specifici sau a mutațiilor genetice. Dacă ați furnizat mari surse de date pentru biomarkeri și mutații, fluxul de lucru ar eșua. Nu sunt conștiente date importante și va trebui să fie modificate sau rescrise pentru a susține date importante.

Cea mai bună practică pentru înțelegerea fluxurilor de lucru și efectul datelor importante este de a face următoarele:

  • Identificați sursele de date importante pe care trebuie să le utilizați.

  • Mapați tipurile mari de date la tipurile de date de flux de lucru.

  • Asigurați-vă că aveți viteza de procesare și accesul la spațiu de stocare pentru a vă susține fluxul de lucru.

  • Selectați depozitul de date cel mai potrivit pentru tipurile de date.

  • Modificați fluxul de lucru existent pentru a găzdui date importante sau pentru a crea un flux de lucru cu date mari.

După ce aveți fluxurile mari de date, va fi necesar să le reglați astfel încât să nu vă copleșească sau să vă contamineze analiza.De exemplu, multe surse de date mari nu includ definiții de date bine definite și metadate despre elementele acestor surse. Uneori, aceste surse de date nu au fost curățate. Trebuie să vă asigurați că aveți nivelul corect de cunoștințe despre sursele pe care le veți folosi.

Fluxuri de date mari - dummies

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...