Video: HowTo - Completarea Bazei de Date a Scolii 2024
O parte din datele mari pentru chestii Cheat Sheet
Datele nestructurate sunt diferite de datele structurate, structura este imprevizibilă. Exemple de date nestructurate includ documente, e-mailuri, bloguri, imagini digitale, videoclipuri și imagini din satelit. Acesta include, de asemenea, unele date generate de mașini sau senzori. De fapt, datele nestructurate reprezintă cea mai mare parte a datelor aflate în incinta companiei dvs., precum și externe companiei dvs. în surse private și publice online, cum ar fi Twitter și Facebook.
În trecut, majoritatea companiilor nu au reușit nici să capteze, nici să stocheze acest volum mare de date. Era pur și simplu prea scumpă sau prea copleșitoare. Chiar dacă companiile puteau captura datele, nu aveau instrumentele necesare pentru a analiza cu ușurință datele și pentru a utiliza rezultatele pentru a lua decizii. Foarte puține instrumente ar putea face sens acestor cantități mari de date. Instrumentele existente au fost complexe de utilizat și nu au produs rezultate într-un interval de timp rezonabil.
În cele din urmă, cei care doreau într-adevăr să meargă la efortul enorm de a analiza aceste date au fost forțați să lucreze cu instantanee de date. Acest lucru are efectul nedorit al evenimentelor importante care lipsesc, deoarece nu se aflau într-o instantanee specială.
O abordare care devine din ce în ce mai apreciată ca o modalitate de a obține valoare de afaceri din datele nestructurate este analiza textului, procesul de analiză a textului nestructurat, extragerea informațiilor relevante și transformarea acestuia în informații structurate care pot să fie puse în aplicare în diverse moduri. Procesele de analiză și extracție au avantajul tehnicilor care au originea în lingvistică, statistică și alte discipline informatice.