Acasă Finanțe personale Modificați produsele de Business Intelligence pentru a manipula datele mari

Modificați produsele de Business Intelligence pentru a manipula datele mari

Cuprins:

Video: Genetic Engineering Will Change Everything Forever – CRISPR 2024

Video: Genetic Engineering Will Change Everything Forever – CRISPR 2024
Anonim

Produsele tradiționale de business intelligence nu au fost proiectate cu adevărat pentru a gestiona date importante, astfel încât acestea pot necesita modificări. Acestea au fost concepute pentru a lucra cu date foarte bine structurate, bine înțelese, adesea stocate într-un depozit de date relaționale și afișate pe desktop sau laptop. Această analiză tradițională a inteligenței de afaceri se aplică în mod obișnuit la instantanee de date, mai degrabă decât la întreaga cantitate de date disponibile. Ce diferă de analiza datelor?

Datele de date mari

Datele mari constau în date structurate, semi-structurate și nestructurate. De multe ori aveți multe și puteți fi destul de complexe. Când vă gândiți să o analizați, trebuie să fiți conștienți de potențialele caracteristici ale datelor dvs.:

  • Poate proveni din surse neîncrezătoare. Analiza mare a datelor implică de multe ori agregarea datelor din diferite surse. Acestea pot include atât surse de date interne cât și externe. Cât de demne de încredere sunt aceste surse externe de informații? De exemplu, cât de demn de încredere sunt datele de social media, cum ar fi un tweet? Informațiile pot proveni dintr-o sursă neconfirmată. Integritatea acestor date trebuie luată în considerare în analiză.

  • Poate fi murdar. Dirty data se referă la date inexacte, incomplete sau eronate. Aceasta poate include erorile cuvintelor; un senzor care este rupt, nu este corect calibrat sau corupt într-un fel; sau chiar date duplicate. Cercetătorii de date dezbat despre unde să curățească datele - fie aproape de sursă, fie în timp real.

    Desigur, o școală de gândire spune că datele murdare nu ar trebui să fie curățate deloc, deoarece ar putea conține valori interesante. Strategia de curățare va depinde probabil de sursa și tipul de date și de scopul analizei dvs. De exemplu, dacă dezvoltați un filtru de spam, obiectivul este de a detecta elementele rău din date, deci nu doriți să îl curățați.

  • Raportul semnal-zgomot poate fi scăzut. Cu alte cuvinte, semnalul (informații utile) poate fi doar un procent mic din date; zgomotul este restul. Capacitatea de a extrage un semnal mic de la date zgomotoase face parte din avantajul unor analize de date mari, dar trebuie să știți că semnalul poate fi într-adevăr mic.

  • Poate fi în timp real. În multe cazuri, veți încerca să analizați fluxurile de date în timp real.

Guvernanța mare a datelor va fi o parte importantă a ecuației de analiză. Sub analizele de afaceri vor fi necesare îmbunătățiri la soluțiile de guvernare pentru a asigura veridicitatea provenind din noile surse de date, mai ales că este combinată cu datele de încredere existente stocate într-un depozit.Securitatea datelor și soluțiile de confidențialitate trebuie de asemenea îmbunătățite pentru a sprijini gestionarea / gestionarea datelor importante stocate în cadrul noilor tehnologii.

Algoritmi analitic de date mari

Când analizați analizele de date mari, trebuie să fiți conștienți de faptul că atunci când extindeți dincolo de desktop, algoritmii utilizați de multe ori trebuie să fie refacturați, cod intern fără a afecta funcționarea sa externă. Frumusețea unei infrastructuri de date mari este că puteți rula un model care a fost folosit pentru a lua ore sau zile în câteva minute.

Aceasta vă permite să repetați modelul de sute de ori. Cu toate acestea, dacă executați o regresie pe un miliard de rânduri de date într-un mediu distribuit, trebuie să țineți cont de cerințele de resurse referitoare la volumul de date și locația sa în cluster. Algoritmii dvs. trebuie să fie conștienți de date.

În plus, vânzătorii încep să ofere noi analize concepute pentru a fi amplasate în apropierea surselor mari de date pentru a analiza datele în loc. Această abordare de rulare a analizei mai aproape de sursele de date minimizează cantitatea de date stocate prin păstrarea numai a datelor cu valoare ridicată. De asemenea, vă permite să analizați datele mai devreme, ceea ce este esențial pentru luarea deciziilor în timp real.

Desigur, analizele vor continua să evolueze. De exemplu, este posibil să aveți nevoie de funcții de vizualizare în timp real pentru a afișa date în timp real care se schimbă continuu. Cum practicați un miliard de puncte pe un grafic? Sau, cum lucrați cu algoritmii de predicție, astfel încât aceștia să efectueze o analiză destul de rapidă și destul de profundă pentru a utiliza un set de date complex și tot mai extins? Acesta este un domeniu de cercetare activă.

Sprijin pentru o infrastructură mare de date

Este suficient să spunem că dacă căutați o platformă, trebuie să realizați următoarele:

  • Integrarea tehnologiilor: Infrastructura trebuie să integreze noi tehnologii de date mari tehnologii tradiționale pentru a putea procesa toate tipurile de date mari și pentru a le consuma prin analizele tradiționale.

  • Stocați cantități mari de date disparate: Este posibil să fie necesar un sistem Hadoop întărit de întreprinderi care să poată procesa / stoca / gestiona cantități mari de date în stare de repaus, fie că este structurat, semi-structurat sau nestructurat.

  • Datele procesate în mișcare: Este posibil să fie necesară o capacitate de procesare a fluxului pentru a procesa date în mișcare generate continuu de senzori, dispozitive inteligente, video, audio și jurnale pentru a sprijini luarea deciziilor în timp real.

  • Date depozit: Este posibil să aveți nevoie de o soluție optimizată pentru sarcini de lucru operaționale sau profunde analitic pentru stocarea și gestionarea cantităților tot mai mari de date de încredere.

Și, bineînțeles, aveți nevoie de capacitatea de a integra datele deja existente, împreună cu rezultatele analizei mari a datelor.

Modificați produsele de Business Intelligence pentru a manipula datele mari

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...