Cuprins:
- Attensitatea pentru date mari
- Clarabridge pentru date mari
- IBM pentru date mari
- OpenText pentru date mari
- SAS pentru datele mari
Video: Top 25 Excel 2016 Tips and Tricks 2024
Iată o prezentare generală a câtorva dintre jucătorii din analiza textului mare de date de pe piață. Unele sunt mici, în timp ce altele sunt nume de uz casnic. Unii fac apel la ceea ce fac analizele de date de mare valoare , în timp ce unii se referă doar la el ca la analiza textului.
Attensitatea pentru date mari
Attensity este una dintre companiile originale de analiză de text care au început să dezvolte și să vândă produse cu mai mult de zece ani în urmă. În prezent, are peste 150 de clienți de afaceri și unul dintre cele mai mari grupuri de dezvoltare NLP din lume. Attensity oferă mai multe motoare pentru analiza textului. Acestea includ clasificarea automată, extracția entităților și extracția exhaustivă. Extracția exhaustivă este tehnologia de vârf a Attensity, care extrage automat fapte din textul analizat și organizează aceste informații.
Compania se axează pe analiza și angajarea socială și multicanal prin analizarea textului pentru raportarea din surse interne și externe și apoi direcționarea către utilizatorii de afaceri pentru implicare. Recent, a achiziționat Biz360, o companie de social media care agregă fluxuri imense de social media. Acesta a dezvoltat un sistem de grid computing care oferă capabilități de înaltă performanță pentru procesarea unor cantități masive de text în timp real.
Attensity utilizează un cadru Hadoop pentru stocarea datelor. De asemenea, acesta are un sistem de așteptare a datelor care creează un proces de orchestrare care recunoaște vârfurile în datele de intrare și ajustează procesarea pe mai multe / mai puține servere, după cum este necesar.
Clarabridge pentru date mari
Un alt furnizor de analize de text, Clarabridge este de fapt un spin-off al unei firme de consultanță în afaceri (BI), numită Claraview, care a realizat nevoia de a trata datele nestructurate. Obiectivul său este de a ajuta companiile să realizeze o valoare măsurabilă a afacerilor prin analizarea holistică a clienților, prin identificarea experiențelor și a problemelor cheie și prin sprijinirea tuturor celor care participă la o organizație să întreprindă acțiuni și să colaboreze în timp real.
Aceasta include determinarea în timp real a sentimentului și clasificarea datelor / textului de feedback din partea clientului și introducerea verbatimului pentru procesarea ulterioară în sistemul Clarabridge.
În prezent, Clarabridge oferă clienților săi câteva caracteristici sofisticate și interesante, inclusiv analiza cauzelor cauzate de un singur clic, pentru a identifica ce provoacă o schimbare a volumului fluxurilor de text, sentimentului sau satisfacției asociate cu problemele apărute. De asemenea, oferă soluția sa ca software-ul ca serviciu (SaaS).
IBM pentru date mari
Gigantul software IBM oferă mai multe soluții în spațiul de analiză a textului, sub umbrela strategiei Smarter Planet.În afară de Watson și IBM SPSS, IBM oferă și IBM Content Analytics cu Enterprise Search. IBM Content Analytics a fost dezvoltat pe baza lucrărilor efectuate la IBM Research.
IBM Content Analytics este folosit pentru a transforma conținutul în informații analizate și acest lucru este disponibil pentru analize detaliate similare cu modul în care datele structurate ar fi analizate într-un set de instrumente BI. IBM Content Analytics și Enterprise Search au fost odată două produse separate.
Soluția convergentă vizează atât căutarea de întreprinderi îmbunătățită care utilizează analize de text, cât și nevoi de analiză a conținutului autonom. ICAES are o integrare strânsă cu platforma IBM InfoSphere BigInsights, permițând colecții foarte mari de căutare și analiză de conținut.
OpenText pentru date mari
OpenText, o companie cu sediul în Canada, este probabil cea mai cunoscută pentru rolul său de lider în soluțiile de management al informațiilor pentru întreprinderi. Viziunea sa se referă la gestionarea, securizarea și extragerea valorii din datele nestructurate ale întreprinderilor. Oferă ceea ce se numește "middleware semantic". "
Potrivit companiei, evoluția sa tehnologică semantică își are rădăcinile în capacitatea sa" de a permite analiza în timp real cu mare precizie pe seturi mari de date în limbi, formate și domenii ale industriei. "Ideea din spatele middleware-ului semantic este că semantica poate fi expusă la diferite niveluri și poate lucra cu tehnologii diferite pentru a aborda problemele de afaceri.
Cu alte cuvinte, analiza textului poate fi activată și utilizată acolo unde este necesar.
SAS pentru datele mari
SAS a rezolvat mult timp probleme complexe de date. Cu câțiva ani în urmă, a achiziționat vânzătorul de analize de text Teragram pentru a-și îmbunătăți strategia de utilizare a datelor atât structurate cât și nestructurate în analiză și pentru a integra aceste date pentru modelarea descriptivă și predictivă. Acum, capabilitățile de analiză a textului fac parte din platforma generală de analiză, iar datele de text sunt considerate pur și simplu o altă sursă de date.
SAS continuă să inoveze în domeniul analizelor de înaltă performanță pentru a se asigura că performanța răspunde așteptărilor clienților. Scopul este de a lua probleme care au fost folosite pentru a lua săptămâni pentru a le rezolva și a le rezolva în zile, sau probleme care obișnuiau să ia zile pentru a le rezolva și a le rezolva în câteva minute.
De exemplu, serverul SAS High Performance Analytics este o soluție în memorie care vă permite să dezvoltați modele analitice utilizând date complete, nu doar un subset de date agregate. SAS spune că puteți folosi mii de variabile și milioane de documente ca parte a acestei analize. Soluția rulează pe aparatele EMC Greenplum sau Teradata, precum și pe hardware-ul de mărfuri care utilizează Hadoop Distributed File System (HDFS).