Cuprins:
Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024
În multe cazuri, analiza mare a datelor va fi reprezentată utilizatorului final prin rapoarte și vizualizări. Deoarece datele brute pot fi variate incomprehensiv, va trebui să vă bazați pe instrumentele și tehnicile de analiză pentru a vă ajuta să prezentați datele într-un mod semnificativ.
Sunt disponibile noi aplicații și vor cădea pe larg în două categorii: personalizate sau semi-personalizate.
Aplicații personalizate pentru analiza datelor
În general, o aplicație personalizată este creată pentru un anumit scop sau un set conex de scopuri. Pentru analiza datelor importante, scopul dezvoltării aplicațiilor personalizate este de a accelera procesul de luare a deciziilor sau de acțiune.
Mediul R
Mediul "R" se bazează pe statisticile "S" și limbajul de analiză elaborat în anii 1990 de Bell Laboratories. Acesta este menținut de proiectul GNU și este disponibil sub licența GNU.
componente eficiente de manipulare și manipulare a datelor.Operatori pentru calcule pe magistrale și alte tipuri de date ordonate.
-
Instrumente specifice unei game largi de analize de date.
-
Capabilități avansate de vizualizare.
-
Limbajul de programare S proiectat de programatori, pentru programatori cu multe constructe familiare, incluzând condiționalități, bucle, funcții recursive definite de utilizator și o gamă largă de facilități de intrare și ieșire.
-
R este bine adaptat aplicațiilor de o singură utilizare, personalizate pentru analiza surselor mari de date.
-
API-ul Google Prediction
API-ul Google Prediction este un exemplu de clasă emergentă de instrumente de analiză a datelor. Este disponibil pe site-ul dezvoltatorilor Google și este bine documentat și furnizat cu mai multe mecanisme de acces folosind diferite limbi de programare. Pentru a vă ajuta să începeți, este disponibil gratuit timp de șase luni.
API-ul de predicție este destul de simplu. Se caută modele și le potrivește cu modele prescriptive, prescriptive sau altele.În timp ce efectuează modelul de potrivire, de asemenea, "învață. Cu cât o folosiți mai mult, cu atât devine mai inteligent.
Predicția este implementată ca un API RESTful cu suport pentru limbă pentru. NET, Java, PHP, JavaScript, Python, Ruby și multe altele. Google oferă, de asemenea, scripturi pentru accesarea API, precum și o bibliotecă de clienți pentru R.
Analiza predictivă este una dintre cele mai puternice capabilități potențiale ale datelor mari și API-ul Google Prediction este un instrument foarte util pentru crearea de aplicații personalizate.
Aplicații semi-personalizate pentru analiza datelor
În adevăr, ceea ce mulți oameni percep ca aplicații personalizate sunt de fapt create folosind componente "ambalate" sau terțe părți cum ar fi bibliotecile. Nu este întotdeauna necesar să codificați complet o nouă aplicație. Folosind aplicații sau componente ambalate, dezvoltatorii sau analiștii trebuie să scrie coduri pentru a "lega împreună" aceste componente într-o aplicație particularizată de lucru. Următoarele sunt motivele pentru care aceasta este o abordare solidă:
Viteza la implementare:
Pentru că nu trebuie să scrieți fiecare parte a aplicației, timpul de dezvoltare poate fi redus foarte mult.
-
Stabilitate: Folosirea unor componente bine construite, fiabile, de la terți poate contribui la îmbunătățirea rezistenței aplicației personalizate.
-
Calitate mai bună: Componentele ambalate sunt adesea supuse unor standarde de calitate superioare, deoarece sunt implementate într-o mare varietate de medii și domenii.
-
Mai multă flexibilitate: Dacă vine o componentă mai bună, aceasta poate fi schimbată în aplicație, extindând durata de viață, adaptabilitatea și utilitatea aplicației personalizate.
-
Un alt tip de aplicație semi-personalizată este una în care codul sursă este disponibil și este modificat pentru un anumit scop. Aceasta poate fi o abordare eficientă deoarece există puține exemple de blocuri de aplicații disponibile pentru a fi incluse în aplicația dvs. semi-particulară: TA-Lib:
Biblioteca de analiză tehnică este utilizată extensiv de dezvoltatorii de software care au nevoie să efectuarea analizei tehnice a datelor de pe piața financiară. Acesta este disponibil sub licența BSD ca sursă deschisă, permițându-i să fie integrat în aplicații semi-personalizate.
-
JUNG: Cadrul Java Universal Network Graph este o bibliotecă care oferă un cadru comun pentru analiza și vizualizarea datelor care pot fi reprezentate de un grafic sau o rețea. Este utilă pentru analiza rețelelor sociale, pentru măsurile de importanță și pentru exploatarea datelor. Este disponibil sub licența BSD ca licență BSD.
-
GeoTools: Un set de instrumente geospatiale open source pentru manipularea datelor GIS în mai multe forme, analizarea atributelor spațiale și non-spațiale sau a datelor GIS și crearea de grafice și rețele de date. Acesta este disponibil sub licența GPL2, permițând integrarea în aplicații semi-personalizate.
-