Cuprins:
- Extracția și îmbogățirea entității
- Căutați și alertați
- Funcții agregate
- Cartografierea și inteligența afacerii
Video: Autohipnoza pentru Vizualizare 2025
Stocarea și recuperarea unor cantități mari de date și realizarea unor astfel de operații este excelentă și odată ce aveți noile date gestionate în NoSQL, puteți face lucruri minunate.
Extracția și îmbogățirea entității
Puteți utiliza declanșatoarele bazei de date, acțiunile de alertă și sistemele externe pentru a analiza datele sursă. Poate că este mai mult text liber, dar menționează subiecte cunoscute. Aceste declanșatoare și acțiuni de alertă ar putea evidenția textul ca fiind o persoană sau o organizație, marcând efectiv conținutul în sine și documentul pe care îl conține.
Un exemplu bun este conținutul dintr-un articol de știri. Puteți utiliza un instrument ca Apache Stanbol sau OpenCalais pentru a identifica termenii cheie. Aceste instrumente pot vedea "președintele Putin" și decid că aceasta se referă la o persoană numită Vladimir Putin, care este rusă, și este actualul președinte al Federației Ruse.
Alte exemple includ nume de boală și medicamente, organizații, subiecte de conversație, produse menționate și dacă un comentariu a fost pozitiv sau negativ.
Acestea sunt toate exemplele de extracție a entității (care este procesul de extragere automată a tipurilor de obiecte din numele lor textual) . Prin identificarea termenilor cheie, le puteți eticheta sau le puteți împacheta într-un element XML, ceea ce vă ajută să căutați mai eficient conținutul.
Îmbogățirea entității înseamnă adăugarea de informații pe baza textului original, pe lângă identificarea acestuia. În exemplul lui Putin, poți transforma cuvântul simplu "Putin" în președintele Putin. Alternativ, puteți transforma Londra în Londra.
Puteți afișa aceste date într-o interfață de utilizator ca text evidențiat, cu un link către informații suplimentare despre fiecare subiect.
Puteți oferi îmbogățiri prin folosirea căutării textului liber, a alertei, a declanșatorilor de baze de date și a integrării software-urilor externe, cum ar fi TEMIS Luxid și SmartLogic.
Căutați și alertați
După ce stocați informațiile dvs., vă recomandăm să le căutați. Căutarea cu text liber este simplă, dar după ce ați efectuat extragerea entității, aveți mai multe opțiuni. Puteți căuta în mod specific pentru o persoană numită "Orange" (ca în cazul lui William of Orange), mai degrabă decât căutați înregistrări care menționează termenul portocaliu - care, desigur, este de asemenea o culoare și un fruct.
Acest lucru are ca rezultat o căutare mai detaliată. De asemenea, permite navigarea faceted. Dacă mergeți la Amazon și căutați pentru Harry Potter, veți vedea categorii pentru cărți, filme, jocuri și așa mai departe. Categoria de produse este un exemplu de fațetă , care vă arată un aspect al datelor din rezultatele căutării - adică valorile cele mai comune ale fiecărei fețe în toate rezultatele căutării, chiar cele care nu se află pe pagina curentă.
Interfețele utilizator pot sprijini explorările bogate în date (precum și căutările esențiale de tip Google). Utilizatorii le pot utiliza, de asemenea, pentru a salva și a încărca căutările anterioare.
Puteți seta criterii de căutare salvate astfel încât alertele să fie activate atunci când înregistrările nou adăugate corespund acelor criterii. Deci, dacă apare o nouă înregistrare care să corespundă criteriilor de căutare, apare o acțiune. Poate Putin devine Putin
Nu toate motoarele de cautare sunt capabile sa faca fiecare termen de interogare o alerta. Unele sunt limitate la câmpurile de text; alții nu pot face criterii geospațiale. Asigurați-vă că dvs. puteți gestiona alertele pe care trebuie să le configurați.
Funcții agregate
Odată ce găsiți informații relevante, vă recomandăm să săturați mai adânc. În funcție de sursă, ați putea întreba câte țări au un PIB mai mare de 400 de miliarde de dolari, sau care este vârsta medie a tuturor membrilor din familia dvs. de familie sau unde se produc cele mai multe băuturi de șarpe în Australia. Aceste exemple ilustrează modul în care sunt efectuate analizele pe un set de rezultate de căutare. Acestea sunt contorizarea, media medie și calcule geospațiale pentru hărțile termice.
A fi capabil să facă astfel de calcule lângă date oferă mai multe avantaje. Primul avantaj este că puteți utiliza indicii pentru a accelera lucrurile. În al doilea rând, este posibil ca acești indicatori să fie stocați în cache în memorie, făcându-i chiar mai repede. În al treilea rând, indiciile de memorie sunt deosebit de utile pentru o bază de date NoSQL care utilizează stocarea sistemului Hadoop File System (HDFS). HDFS nu face indexarea nativă sau stocarea în memorie în coloană pentru calculele de agregare rapidă - ea necesită o bază de date NoSQL în partea de sus pentru a face acest lucru.
Navigarea facetted este un exemplu de agregări bazate pe contor pe rezultatele căutării care apar într-o interfață de utilizator. Același lucru este valabil și pentru o cronologie care arată numărul de înregistrări care menționează un anumit moment în timp. De exemplu, doriți să afișați rezultate din acest an, în această lună sau în această oră?
Dacă doriți această funcție, asigurați-vă că baza dvs. de date are capacitatea de a calcula agregate în mod eficient lângă date. Majoritatea bazelor de date NoSQL fac, dar unele nu.
Cartografierea și inteligența afacerii
Următoarea extensie evidentă pentru interfața cu utilizatorul implică evidențierea și vizualizarea rezumatelor de tabele pentru informațiile de gestionare live și analiza istorică a business intelligence.
Majoritatea bazelor de date NoSQL oferă un API REST ușor de integrat în bazele lor de date. Aceasta înseamnă că puteți conecta o serie de niveluri de aplicații sau chiar puteți conecta direct aplicațiile JavaScript la aceste baze de date. Pentru JavaScript este disponibilă o varietate de biblioteci de diagrame excelente. Puteți utiliza chiar ecosistemul R pentru a crea diagrame pe baza datelor deținute în aceste baze de date, după instalarea unui conector adecvat pentru baza de date.
Unele baze de date NoSQL furnizează chiar și un plug-in de date relațional ODBC sau JDBC. Crearea de indexuri într-o înregistrare dată și afișarea lor ca vedere vizuală este o modalitate de a transforma datele nestructurate într-o bază de date a documentelor NoSQL în date care pot fi analizate cu ajutorul unui instrument de business intelligence.
Verificați dacă furnizorul de baze de date NoSQL furnizează instrumente de vizualizare sau are parteneri de afaceri cu instrumente care se pot conecta la aceste baze de date. Printre instrumentele vogue se numără Tableau Server, un server modern de comunicații business-intelligence care permite publicarea rapoartelor interactive pe date într-o varietate de baze de date, inclusiv baze de date NoSQL.