Acasă Finanțe personale Text Analiza Instrumente pentru Big Data - dummies

Text Analiza Instrumente pentru Big Data - dummies

Cuprins:

Video: Top 25 Excel 2016 Tips and Tricks 2024

Video: Top 25 Excel 2016 Tips and Tricks 2024
Anonim

Iată o prezentare generală a câtorva dintre jucătorii din analiza textului mare de date de pe piață. Unele sunt mici, în timp ce altele sunt nume de uz casnic. Unii fac apel la ceea ce fac analizele de date de mare valoare , în timp ce unii se referă doar la el ca la analiza textului.

Attensitatea pentru date mari

Attensity este una dintre companiile originale de analiză de text care au început să dezvolte și să vândă produse cu mai mult de zece ani în urmă. În prezent, are peste 150 de clienți de afaceri și unul dintre cele mai mari grupuri de dezvoltare NLP din lume. Attensity oferă mai multe motoare pentru analiza textului. Acestea includ clasificarea automată, extracția entităților și extracția exhaustivă. Extracția exhaustivă este tehnologia de vârf a Attensity, care extrage automat fapte din textul analizat și organizează aceste informații.

Compania se axează pe analiza și angajarea socială și multicanal prin analizarea textului pentru raportarea din surse interne și externe și apoi direcționarea către utilizatorii de afaceri pentru implicare. Recent, a achiziționat Biz360, o companie de social media care agregă fluxuri imense de social media. Acesta a dezvoltat un sistem de grid computing care oferă capabilități de înaltă performanță pentru procesarea unor cantități masive de text în timp real.

Attensity utilizează un cadru Hadoop pentru stocarea datelor. De asemenea, acesta are un sistem de așteptare a datelor care creează un proces de orchestrare care recunoaște vârfurile în datele de intrare și ajustează procesarea pe mai multe / mai puține servere, după cum este necesar.

Clarabridge pentru date mari

Un alt furnizor de analize de text, Clarabridge este de fapt un spin-off al unei firme de consultanță în afaceri (BI), numită Claraview, care a realizat nevoia de a trata datele nestructurate. Obiectivul său este de a ajuta companiile să realizeze o valoare măsurabilă a afacerilor prin analizarea holistică a clienților, prin identificarea experiențelor și a problemelor cheie și prin sprijinirea tuturor celor care participă la o organizație să întreprindă acțiuni și să colaboreze în timp real.

Aceasta include determinarea în timp real a sentimentului și clasificarea datelor / textului de feedback din partea clientului și introducerea verbatimului pentru procesarea ulterioară în sistemul Clarabridge.

În prezent, Clarabridge oferă clienților săi câteva caracteristici sofisticate și interesante, inclusiv analiza cauzelor cauzate de un singur clic, pentru a identifica ce provoacă o schimbare a volumului fluxurilor de text, sentimentului sau satisfacției asociate cu problemele apărute. De asemenea, oferă soluția sa ca software-ul ca serviciu (SaaS).

IBM pentru date mari

Gigantul software IBM oferă mai multe soluții în spațiul de analiză a textului, sub umbrela strategiei Smarter Planet.În afară de Watson și IBM SPSS, IBM oferă și IBM Content Analytics cu Enterprise Search. IBM Content Analytics a fost dezvoltat pe baza lucrărilor efectuate la IBM Research.

IBM Content Analytics este folosit pentru a transforma conținutul în informații analizate și acest lucru este disponibil pentru analize detaliate similare cu modul în care datele structurate ar fi analizate într-un set de instrumente BI. IBM Content Analytics și Enterprise Search au fost odată două produse separate.

Soluția convergentă vizează atât căutarea de întreprinderi îmbunătățită care utilizează analize de text, cât și nevoi de analiză a conținutului autonom. ICAES are o integrare strânsă cu platforma IBM InfoSphere BigInsights, permițând colecții foarte mari de căutare și analiză de conținut.

OpenText pentru date mari

OpenText, o companie cu sediul în Canada, este probabil cea mai cunoscută pentru rolul său de lider în soluțiile de management al informațiilor pentru întreprinderi. Viziunea sa se referă la gestionarea, securizarea și extragerea valorii din datele nestructurate ale întreprinderilor. Oferă ceea ce se numește "middleware semantic". "

Potrivit companiei, evoluția sa tehnologică semantică își are rădăcinile în capacitatea sa" de a permite analiza în timp real cu mare precizie pe seturi mari de date în limbi, formate și domenii ale industriei. "Ideea din spatele middleware-ului semantic este că semantica poate fi expusă la diferite niveluri și poate lucra cu tehnologii diferite pentru a aborda problemele de afaceri.

Cu alte cuvinte, analiza textului poate fi activată și utilizată acolo unde este necesar.

SAS pentru datele mari

SAS a rezolvat mult timp probleme complexe de date. Cu câțiva ani în urmă, a achiziționat vânzătorul de analize de text Teragram pentru a-și îmbunătăți strategia de utilizare a datelor atât structurate cât și nestructurate în analiză și pentru a integra aceste date pentru modelarea descriptivă și predictivă. Acum, capabilitățile de analiză a textului fac parte din platforma generală de analiză, iar datele de text sunt considerate pur și simplu o altă sursă de date.

SAS continuă să inoveze în domeniul analizelor de înaltă performanță pentru a se asigura că performanța răspunde așteptărilor clienților. Scopul este de a lua probleme care au fost folosite pentru a lua săptămâni pentru a le rezolva și a le rezolva în zile, sau probleme care obișnuiau să ia zile pentru a le rezolva și a le rezolva în câteva minute.

De exemplu, serverul SAS High Performance Analytics este o soluție în memorie care vă permite să dezvoltați modele analitice utilizând date complete, nu doar un subset de date agregate. SAS spune că puteți folosi mii de variabile și milioane de documente ca parte a acestei analize. Soluția rulează pe aparatele EMC Greenplum sau Teradata, precum și pe hardware-ul de mărfuri care utilizează Hadoop Distributed File System (HDFS).

Text Analiza Instrumente pentru Big Data - dummies

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...