Video: 8 - Как сделать правильно фундамент дома! На чем нельзя экономить | Строительство DIY 2024
Analiza de date a ajuns foarte mult în ultima vreme și din motive întemeiate. Veți avea nevoie să cunoașteți caracteristicile unei analize de mari dimensiuni dacă vreți să faceți parte din această mișcare. Companiile știu că ceva este acolo, dar până de curând nu au reușit să-l facă. Acest lucru împinge plicul pe analiză este un aspect interesant al mișcării mari de analiză a datelor.
Companiile sunt încântate să aibă acces la și să analizeze datele pe care le colectează sau care doresc să le obțină, dar care nu au reușit să le gestioneze sau să le analizeze în mod eficient. Ar putea implica vizualizarea unor cantități uriașe de date disparate sau ar putea implica o analiză avansată a fluxului de date la dvs. în timp real. Este evolutiv în unele privințe și revoluționar în altele.
Deci, ce diferă atunci când compania dvs. împinge plicul cu o analiză de date? Infrastructura care susține o analiză mare a datelor este diferită, iar algoritmii au fost modificați pentru a fi conștienți de infrastructură.
Analiza mare a datelor ar trebui privită din două perspective:
-
Orientată spre decizie
-
Orientată spre acțiune
Analiza orientată spre decizie este mai apropiată de inteligența tradițională a afacerilor. Uită-te la subseturi selective și reprezentări ale surselor de date mai mari și încercați să aplicați rezultatele procesului de luare a deciziilor de afaceri. Cu siguranță, aceste decizii ar putea avea ca rezultat o anumită acțiune sau o schimbare de proces, însă scopul analizei este de a spori procesul de luare a deciziilor.
Analiza orientată spre acțiune este utilizată pentru reacția rapidă, atunci când apare un tipar sau sunt detectate anumite tipuri de date și este necesară o acțiune. Profitând de datele mari prin analiză și provocând schimbări comportamentale proactive sau reactive oferă un mare potențial pentru cei care au adoptat inițial.
Găsirea și utilizarea datelor mari prin crearea de aplicații de analiză pot ține cheia pentru extragerea valorii mai devreme decât mai târziu. Pentru a îndeplini această sarcină, este mai eficient să construiți aceste aplicații personalizate de la zero sau prin utilizarea de platforme și / sau componente.
programatic. Una dintre cele mai mari schimbări în analiză este că în trecut ați avut de-a face cu seturi de date pe care le puteați încărca manual într-o aplicație și explorați. Cu o analiză mare a datelor, s-ar putea să vă confruntați cu o situație în care ar trebui să începeți cu date brute care, de multe ori, trebuie gestionate programabil pentru a face orice fel de explorare din cauza amplorii datelor. Poate fi
condusă de date. În timp ce mulți oameni de știință folosesc o abordare bazată pe ipoteze la analiza datelor (dezvoltați o premisă și colectați date pentru a vedea dacă această premisă este corectă), puteți utiliza datele pentru a conduce analiza - mai ales dacă ați adunat imens cantități din acesta. De exemplu, puteți utiliza un algoritm de învățare a mașinilor pentru a face acest tip de analiză fără ipoteze. Poate folosi multe atribute
. În trecut, s-ar putea să fi avut de-a face cu sute de atribute sau caracteristici ale acelei surse de date. Acum ar putea fi vorba de sute de gigaocteți de date care constau în mii de atribute și milioane de observații. Totul se întâmplă acum pe o scară mai mare. Acesta poate fi
iterativ. Mai multă putere de calcul înseamnă că puteți itera pe modelele dvs. până când le obțineți cum doriți. Iată un exemplu. Să presupunem că construiți un model care încearcă să găsească predictorii pentru anumite comportamente asociate clienților. S-ar putea să începi să extragi un eșantion rezonabil de date sau să te conectezi la locul în care se află datele. Puteți construi un model pentru a testa o ipoteză. Întrucât în trecut s-ar putea să nu ai avut prea multă memorie pentru a face modelul tău să funcționeze eficient, vei avea nevoie de o cantitate imensă de memorie fizică pentru a trece prin iterațiile necesare pentru a antrena algoritmul. De asemenea, ar putea fi necesar să se utilizeze tehnici de calcul avansate, cum ar fi procesarea limbajului natural sau rețele neuronale care dezvoltă automat modelul bazat pe învățare, pe măsură ce se adaugă mai multe date.
Poate fi
rapid pentru a obține ciclurile de calcul de care aveți nevoie prin utilizarea unei infrastructuri bazate pe cloud ca serviciu. Cu platformele de infrastructură ca serviciu (IaaS), cum ar fi serviciile Amazon Cloud Services (ACS), puteți furniza rapid un grup de mașini pentru a ingera seturi de date mari și pentru a le analiza rapid.