Acasă Finanțe personale Caracteristicile analizei mari a datelor - dummy

Caracteristicile analizei mari a datelor - dummy

Video: 8 - Как сделать правильно фундамент дома! На чем нельзя экономить | Строительство DIY 2024

Video: 8 - Как сделать правильно фундамент дома! На чем нельзя экономить | Строительство DIY 2024
Anonim

Analiza de date a ajuns foarte mult în ultima vreme și din motive întemeiate. Veți avea nevoie să cunoașteți caracteristicile unei analize de mari dimensiuni dacă vreți să faceți parte din această mișcare. Companiile știu că ceva este acolo, dar până de curând nu au reușit să-l facă. Acest lucru împinge plicul pe analiză este un aspect interesant al mișcării mari de analiză a datelor.

Companiile sunt încântate să aibă acces la și să analizeze datele pe care le colectează sau care doresc să le obțină, dar care nu au reușit să le gestioneze sau să le analizeze în mod eficient. Ar putea implica vizualizarea unor cantități uriașe de date disparate sau ar putea implica o analiză avansată a fluxului de date la dvs. în timp real. Este evolutiv în unele privințe și revoluționar în altele.

Deci, ce diferă atunci când compania dvs. împinge plicul cu o analiză de date? Infrastructura care susține o analiză mare a datelor este diferită, iar algoritmii au fost modificați pentru a fi conștienți de infrastructură.

Analiza mare a datelor ar trebui privită din două perspective:

  • Orientată spre decizie

  • Orientată spre acțiune

Analiza orientată spre decizie este mai apropiată de inteligența tradițională a afacerilor. Uită-te la subseturi selective și reprezentări ale surselor de date mai mari și încercați să aplicați rezultatele procesului de luare a deciziilor de afaceri. Cu siguranță, aceste decizii ar putea avea ca rezultat o anumită acțiune sau o schimbare de proces, însă scopul analizei este de a spori procesul de luare a deciziilor.

Analiza orientată spre acțiune este utilizată pentru reacția rapidă, atunci când apare un tipar sau sunt detectate anumite tipuri de date și este necesară o acțiune. Profitând de datele mari prin analiză și provocând schimbări comportamentale proactive sau reactive oferă un mare potențial pentru cei care au adoptat inițial.

Găsirea și utilizarea datelor mari prin crearea de aplicații de analiză pot ține cheia pentru extragerea valorii mai devreme decât mai târziu. Pentru a îndeplini această sarcină, este mai eficient să construiți aceste aplicații personalizate de la zero sau prin utilizarea de platforme și / sau componente.

  • programatic. Una dintre cele mai mari schimbări în analiză este că în trecut ați avut de-a face cu seturi de date pe care le puteați încărca manual într-o aplicație și explorați. Cu o analiză mare a datelor, s-ar putea să vă confruntați cu o situație în care ar trebui să începeți cu date brute care, de multe ori, trebuie gestionate programabil pentru a face orice fel de explorare din cauza amplorii datelor. Poate fi

  • condusă de date. În timp ce mulți oameni de știință folosesc o abordare bazată pe ipoteze la analiza datelor (dezvoltați o premisă și colectați date pentru a vedea dacă această premisă este corectă), puteți utiliza datele pentru a conduce analiza - mai ales dacă ați adunat imens cantități din acesta. De exemplu, puteți utiliza un algoritm de învățare a mașinilor pentru a face acest tip de analiză fără ipoteze. Poate folosi multe atribute

  • . În trecut, s-ar putea să fi avut de-a face cu sute de atribute sau caracteristici ale acelei surse de date. Acum ar putea fi vorba de sute de gigaocteți de date care constau în mii de atribute și milioane de observații. Totul se întâmplă acum pe o scară mai mare. Acesta poate fi

  • iterativ. Mai multă putere de calcul înseamnă că puteți itera pe modelele dvs. până când le obțineți cum doriți. Iată un exemplu. Să presupunem că construiți un model care încearcă să găsească predictorii pentru anumite comportamente asociate clienților. S-ar putea să începi să extragi un eșantion rezonabil de date sau să te conectezi la locul în care se află datele. Puteți construi un model pentru a testa o ipoteză. Întrucât în ​​trecut s-ar putea să nu ai avut prea multă memorie pentru a face modelul tău să funcționeze eficient, vei avea nevoie de o cantitate imensă de memorie fizică pentru a trece prin iterațiile necesare pentru a antrena algoritmul. De asemenea, ar putea fi necesar să se utilizeze tehnici de calcul avansate, cum ar fi procesarea limbajului natural sau rețele neuronale care dezvoltă automat modelul bazat pe învățare, pe măsură ce se adaugă mai multe date.

    Poate fi

  • rapid pentru a obține ciclurile de calcul de care aveți nevoie prin utilizarea unei infrastructuri bazate pe cloud ca serviciu. Cu platformele de infrastructură ca serviciu (IaaS), cum ar fi serviciile Amazon Cloud Services (ACS), puteți furniza rapid un grup de mașini pentru a ingera seturi de date mari și pentru a le analiza rapid.

  • Caracteristicile analizei mari a datelor - dummy

    Alegerea editorilor

    Evaluarea Vizualizărilor de date - dummies

    Evaluarea Vizualizărilor de date - dummies

    Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

    Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

    Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

    Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

    Infografice nevergreen: Închirierea obiectelor Build - dummies

    Infografice nevergreen: Închirierea obiectelor Build - dummies

    Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

    Alegerea editorilor

    Utilizați Zoom în Adobe Photoshop CS5 - manechine

    Utilizați Zoom în Adobe Photoshop CS5 - manechine

    Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

    Text în Photoshop CC - dummies

    Text în Photoshop CC - dummies

    Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

    Alegerea editorilor

    Cum se adaugă Biblioteca RegEx în C ++ - dummies

    Cum se adaugă Biblioteca RegEx în C ++ - dummies

    Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

    Cum Heap Works în C ++ - dummies

    Cum Heap Works în C ++ - dummies

    Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

    Cum să evitați codul de injectare în C ++ - dummies

    Cum să evitați codul de injectare în C ++ - dummies

    Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...