Video: ALIEN MAN by MUGLER REVIEW en ESPAÑOL 2019 2024
Analiza sentimentului social este ușor cea mai exagerată utilizările lui Hadoop, care nu ar trebui să fie o surpriză, având în vedere că lumea este în permanență conectată și populația actuală expresivă. Acest caz de utilizare folosește conținut din forumuri, bloguri și alte resurse media sociale pentru a dezvolta un sentiment al ceea ce fac oamenii (de exemplu, evenimentele de viață) și modul în care reacționează la lumea din jurul lor (sentimentul).
Deoarece datele bazate pe text nu se încadrează în mod natural într-o bază de date relațională, Hadoop este un loc practic pentru a explora și a rula analizele pe aceste date.
Limbajul este dificil de interpretat, chiar și pentru ființele umane uneori - mai ales dacă citiți textul scris de oameni într-un grup social diferit de cel al dvs. Acest grup de persoane poate vorbește limba dvs., dar expresiile și stilul lor sunt complet străine, deci nu aveți nicio idee dacă vorbește despre o experiență bună sau despre una rea.
bomba în legătură cu un film, ar putea însemna că filmul a fost rău (sau bun, dacă sunteți parte din tineret mișcare care interpretează "Este o bombă da" ca un compliment); desigur, dacă sunteți în domeniul securității companiilor aeriene, cuvântul bomba are un înțeles destul de diferit. Ideea este că limbajul este folosit în multe moduri variabile și este în continuă evoluție. Când analizați sentimentul pe social media, puteți alege din mai multe abordări. Metoda de bază parcurge programatic textul, extrage șiruri și aplică reguli. În situații simple, această abordare este rezonabilă. Dar, pe măsură ce cerințele evoluează și regulile devin mai complexe, codarea manuală a extraselor de text devine repede imposibilă din perspectiva întreținerii codurilor, în special pentru optimizarea performanțelor.
Alternativ, o abordare bazată pe statistici devine tot mai frecventă pentru analiza sentimentului. Mai degrabă decât să scrieți manual reguli complexe, puteți utiliza modelele de învățare a mașinilor orientate spre clasificare în Apache Mahout. Captura aici este că va trebui să vă instruiți modelele cu exemple de sentimente pozitive și negative. Cele mai multe date de instruire pe care le furnizați (de exemplu, textul din tweet-uri și clasificarea dvs.), cu cât rezultatele dvs. sunt mai exacte.
Cazul de utilizare a analizei sentimentului social poate fi aplicat într-o gamă largă de industrii. De exemplu, luați în considerare siguranța alimentară: Încercarea de a anticipa sau de a identifica focarul bolilor alimentare cât mai repede posibil este extrem de importantă pentru oficiali din domeniul sănătății.
Următoarea figură prezintă o aplicație ancorată de Hadoop care inghite tweets folosind extractoare bazate pe boala potențială: FLU sau OBSERVAȚIE ALIMENTARĂ.
Vedeți harta de căldură generată care arată locația geografică a tweeturilor? O caracteristică a datelor într-o lume cu date mari este că cea mai mare parte este
îmbogățită spațial: Are informații despre localitate (și atributele temporale). În acest caz, profilul Twitter a fost inversat prin căutarea locului publicat. După cum se dovedește, o mulțime de conturi Twitter au locații geografice ca parte a profilurilor lor publice (precum și disclaimer clare care spun că gândurile lor sunt proprii, spre deosebire de a vorbi pentru angajatorii lor).
Cât de bun poate fi un motor de predicție pentru mass-media socială pentru izbucnirea gripei sau a unui incident de intoxicații alimentare? Luați în considerare datele de probă anonime afișate. Puteți vedea că semnalele mass-media sociale au trumpat toți ceilalți indicatori pentru prezicerea unui focar de gripă într-un anumit județ din S.U.E. în timpul vremii de sfârșit de vară și în toamna devreme.
Acest exemplu prezintă un alt beneficiu care se acumulează din analiza mediilor sociale: vă oferă o oportunitate fără precedent de a privi informații despre atribute în profilurile posterelor. Acordat, ceea ce spun oamenii despre ei înșiși în profilurile lor Twitter este adesea incomplet (de exemplu, codul locației nu este completat) sau nu este semnificativ (codul locației ar putea spune
norul). Dar puteți învăța multe despre oameni în timp, pe baza a ceea ce spun ei. De exemplu, un client poate avea tweeted
(postat pe Twitter) anunțul despre nașterea bebelușului, o imagine Instagram a ultimului său pictura sau o postare pe Facebook, declarând că nu poate să creadă comportamentul lui Walter White în ultima noapte Breaking Bad final. În acest exemplu omniprezent, compania dvs. poate extrage un eveniment de viață care cuprinde un grafic de familie (un copil nou este o actualizare valoroasă pentru un profil Master Data Management bazat pe persoană), un hobby (pictura) și un atribut de interes (vă place spectacolul Breaking Bad). Prin analizarea datelor sociale în acest fel, aveți ocazia de a crea atribute personale cu informații cum ar fi hobby-uri, zile de naștere, evenimente de viață, locații geografice (țară, stat și oraș, de exemplu), angajator, starea și multe altele. Să presupunem pentru un minut că sunteți CIO-ul unei companii aeriene. Puteți utiliza postările de călători frecvenți sau furioși frecvent pentru a nu numai a stabili sentimentul, dar, de asemenea, rotunji profilurile clienților pentru programul dvs. de loialitate folosind informații de mass-media sociale.
Imaginați-vă cât de bine ați putea viza potențialii clienți cu informațiile pe care tocmai le-ați trimis - de exemplu un e-mail care spune clientului că Sezonul 5 din
Breaking Bad
este acum disponibil în sistemul media al avionului sau anunțând că copiii sub vârsta de două ani zboară gratuit. Este, de asemenea, un bun exemplu pentru cum sistemele de înregistrare (să zicem, vânzările sau bazele de date de abonament) pot satisface sistemele de angajament (de exemplu, canale de sprijin). Deși răscumpărarea membrilor de fidelitate și istoricul călătoriilor se află într-o bază de date relațională, sistemul de implicare poate actualiza înregistrările (de exemplu, o coloană).