Acasă Finanțe personale Analiza sentimentului social cu Hadoop - dummies

Analiza sentimentului social cu Hadoop - dummies

Video: ALIEN MAN by MUGLER REVIEW en ESPAÑOL 2019 2024

Video: ALIEN MAN by MUGLER REVIEW en ESPAÑOL 2019 2024
Anonim

Analiza sentimentului social este ușor cea mai exagerată utilizările lui Hadoop, care nu ar trebui să fie o surpriză, având în vedere că lumea este în permanență conectată și populația actuală expresivă. Acest caz de utilizare folosește conținut din forumuri, bloguri și alte resurse media sociale pentru a dezvolta un sentiment al ceea ce fac oamenii (de exemplu, evenimentele de viață) și modul în care reacționează la lumea din jurul lor (sentimentul).

Deoarece datele bazate pe text nu se încadrează în mod natural într-o bază de date relațională, Hadoop este un loc practic pentru a explora și a rula analizele pe aceste date.

Limbajul este dificil de interpretat, chiar și pentru ființele umane uneori - mai ales dacă citiți textul scris de oameni într-un grup social diferit de cel al dvs. Acest grup de persoane poate vorbește limba dvs., dar expresiile și stilul lor sunt complet străine, deci nu aveți nicio idee dacă vorbește despre o experiență bună sau despre una rea.

bomba în legătură cu un film, ar putea însemna că filmul a fost rău (sau bun, dacă sunteți parte din tineret mișcare care interpretează "Este o bombă da" ca un compliment); desigur, dacă sunteți în domeniul securității companiilor aeriene, cuvântul bomba are un înțeles destul de diferit. Ideea este că limbajul este folosit în multe moduri variabile și este în continuă evoluție. Când analizați sentimentul pe social media, puteți alege din mai multe abordări. Metoda de bază parcurge programatic textul, extrage șiruri și aplică reguli. În situații simple, această abordare este rezonabilă. Dar, pe măsură ce cerințele evoluează și regulile devin mai complexe, codarea manuală a extraselor de text devine repede imposibilă din perspectiva întreținerii codurilor, în special pentru optimizarea performanțelor.

Abordările bazate pe gramatică și regulile de procesare a textului sunt computațional costisitoare, ceea ce reprezintă un aspect important în extracția pe scară largă în Hadoop. Cu cât sunt implicate mai mult regulile (ceea ce este inevitabil pentru scopuri complexe, cum ar fi extracția sentimentului), cu atât mai multă prelucrare este necesară.

Alternativ, o abordare bazată pe statistici devine tot mai frecventă pentru analiza sentimentului. Mai degrabă decât să scrieți manual reguli complexe, puteți utiliza modelele de învățare a mașinilor orientate spre clasificare în Apache Mahout. Captura aici este că va trebui să vă instruiți modelele cu exemple de sentimente pozitive și negative. Cele mai multe date de instruire pe care le furnizați (de exemplu, textul din tweet-uri și clasificarea dvs.), cu cât rezultatele dvs. sunt mai exacte.

Cazul de utilizare a analizei sentimentului social poate fi aplicat într-o gamă largă de industrii. De exemplu, luați în considerare siguranța alimentară: Încercarea de a anticipa sau de a identifica focarul bolilor alimentare cât mai repede posibil este extrem de importantă pentru oficiali din domeniul sănătății.

Următoarea figură prezintă o aplicație ancorată de Hadoop care inghite tweets folosind extractoare bazate pe boala potențială: FLU sau OBSERVAȚIE ALIMENTARĂ.

Vedeți harta de căldură generată care arată locația geografică a tweeturilor? O caracteristică a datelor într-o lume cu date mari este că cea mai mare parte este

îmbogățită spațial: Are informații despre localitate (și atributele temporale). În acest caz, profilul Twitter a fost inversat prin căutarea locului publicat. După cum se dovedește, o mulțime de conturi Twitter au locații geografice ca parte a profilurilor lor publice (precum și disclaimer clare care spun că gândurile lor sunt proprii, spre deosebire de a vorbi pentru angajatorii lor).

Cât de bun poate fi un motor de predicție pentru mass-media socială pentru izbucnirea gripei sau a unui incident de intoxicații alimentare? Luați în considerare datele de probă anonime afișate. Puteți vedea că semnalele mass-media sociale au trumpat toți ceilalți indicatori pentru prezicerea unui focar de gripă într-un anumit județ din S.U.E. în timpul vremii de sfârșit de vară și în toamna devreme.

Acest exemplu prezintă un alt beneficiu care se acumulează din analiza mediilor sociale: vă oferă o oportunitate fără precedent de a privi informații despre atribute în profilurile posterelor. Acordat, ceea ce spun oamenii despre ei înșiși în profilurile lor Twitter este adesea incomplet (de exemplu, codul locației nu este completat) sau nu este semnificativ (codul locației ar putea spune

norul). Dar puteți învăța multe despre oameni în timp, pe baza a ceea ce spun ei. De exemplu, un client poate avea tweeted

(postat pe Twitter) anunțul despre nașterea bebelușului, o imagine Instagram a ultimului său pictura sau o postare pe Facebook, declarând că nu poate să creadă comportamentul lui Walter White în ultima noapte Breaking Bad final. În acest exemplu omniprezent, compania dvs. poate extrage un eveniment de viață care cuprinde un grafic de familie (un copil nou este o actualizare valoroasă pentru un profil Master Data Management bazat pe persoană), un hobby (pictura) și un atribut de interes (vă place spectacolul Breaking Bad). Prin analizarea datelor sociale în acest fel, aveți ocazia de a crea atribute personale cu informații cum ar fi hobby-uri, zile de naștere, evenimente de viață, locații geografice (țară, stat și oraș, de exemplu), angajator, starea și multe altele. Să presupunem pentru un minut că sunteți CIO-ul unei companii aeriene. Puteți utiliza postările de călători frecvenți sau furioși frecvent pentru a nu numai a stabili sentimentul, dar, de asemenea, rotunji profilurile clienților pentru programul dvs. de loialitate folosind informații de mass-media sociale.

Imaginați-vă cât de bine ați putea viza potențialii clienți cu informațiile pe care tocmai le-ați trimis - de exemplu un e-mail care spune clientului că Sezonul 5 din

Breaking Bad

este acum disponibil în sistemul media al avionului sau anunțând că copiii sub vârsta de două ani zboară gratuit. Este, de asemenea, un bun exemplu pentru cum sistemele de înregistrare (să zicem, vânzările sau bazele de date de abonament) pot satisface sistemele de angajament (de exemplu, canale de sprijin). Deși răscumpărarea membrilor de fidelitate și istoricul călătoriilor se află într-o bază de date relațională, sistemul de implicare poate actualiza înregistrările (de exemplu, o coloană).

Analiza sentimentului social cu Hadoop - dummies

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...