Cuprins:
- Cum se utilizează vizualizările tabulare pentru analiza predictivă
- Diagrame utilizate în analiza predictivă
- Elementele de bază ale diagramelor pieptene pentru analiza predictivă
- Cum se utilizează grafice grafice pentru analiza predictivă
- Elementele de bază ale norilor cuvântului pentru analiza predictivă
- Cum se utilizează reprezentarea păsărilor flocking pentru analiza predictivă
Video: Qué es y cómo se hace un Análisis FODA - Planeación Estratégica - DOFA -SWOT 2024
O imagine este în valoare de o mie de cuvinte - mai ales atunci când încercați să obțineți o bună manevră asupra datelor de analiză predictivă. La etapa de pre-procesare, în timp ce vă pregătiți datele, este o practică obișnuită de a vizualiza ceea ce aveți în mână înainte de a continua la pasul următor.
Începeți utilizând o foaie de calcul, cum ar fi Microsoft Excel, pentru a crea o matrice de date - care conține date (denumite și atribute ). Mai multe pachete software de business intelligence (cum ar fi Tableau) vă pot oferi o imagine de ansamblu preliminară a datelor la care sunteți pe punctul de a aplica analizele.
Cum se utilizează vizualizările tabulare pentru analiza predictivă
Tabelele reprezintă reprezentarea grafică cea mai simplă, cea mai de bază a datelor. Tabelele (cunoscute și sub numele de foi de calcul ) constau din rânduri și coloane - care corespund, respectiv, obiectelor și atributelor lor menționate anterior ca făcându-vă datele. De exemplu, luați în considerare datele privind rețelele sociale online. Un obiect de date ar putea reprezenta un utilizator. Atributele unui utilizator (obiect de date) pot fi titlurile coloanelor: Sex, Cod poștal sau Data nașterii.
Celulele dintr-un tabel reprezintă valori. Vizualizarea în tabele vă poate ajuta să identificați cu ușurință valorile atributelor lipsă ale obiectelor de date.
Tabelele pot oferi, de asemenea, flexibilitatea de a adăuga atribute noi care sunt combinații de alte atribute. De exemplu, în datele rețelei sociale, puteți adăuga o altă coloană numită Vârstă, care poate fi ușor calculată - ca atribut derivat - din atributul de dată de naștere existent. Datele din tabelul de rețea socială arată o nouă coloană, Vârsta, creată dintr-o altă coloană existentă (Data nașterii).
Diagrame utilizate în analiza predictivă
Graficele de bare pot fi folosite pentru a detecta spații sau anomalii ale datelor. Puteți să-l utilizați pentru fiecare atribut pentru a vizualiza rapid valorile minime și maxime. Bar graficele pot fi, de asemenea, utilizate pentru a începe o discuție despre modul de a normaliza datele.
Normalizarea este ajustarea unor valori ale atributelor sau ale tuturor atributelor pe o scară care face datele mai utile. De exemplu, puteți observa cu ușurință că există o eroare în date: Bara de vârstă a unei înregistrări este negativă. Această anomalie este mai ușor descrisă de o diagramă de bare decât de un tabel de date.
Elementele de bază ale diagramelor pieptene pentru analiza predictivă
Tabelele cu diagrame sunt folosite în principal pentru a arăta procente. Ele pot ilustra cu ușurință distribuția mai multor articole și evidențiază cele mai dominante. Datele brute ale rețelei sociale sunt reprezentate în funcție de atributul Age.Observați că graficul arată nu numai o distribuție clară a masculilor față de femei, ci și o eroare probabilă: R ca valoare pentru tipul de gen posibil creată atunci când datele au fost colectate.
Cum se utilizează grafice grafice pentru analiza predictivă
Teoria grafurilor oferă un set de algoritmi puternici care pot analiza datele structurate și reprezentate ca un grafic. În domeniul informaticii, un grafic este structura de date, o modalitate de a organiza date care reprezintă relațiile dintre perechi de obiecte de date. Un grafic este alcătuit din două părți principale:
-
Vertex, cunoscut și ca noduri
-
Margini care conectează perechi de noduri
Marginile pot fi direcționate (săgeată) și pot avea greutăți. Puteți decide să plasați o margine (săgeată) între două noduri (cercuri) - în acest caz, membrii rețelei sociale care sunt conectați la alți membri ca prieteni:
Direcția săgeții indică cine "prieteni", sau care inițiază interacțiunile de cele mai multe ori.
Elementele de bază ale norilor cuvântului pentru analiza predictivă
Luați în considerare o listă de cuvinte sau concepte aranjate ca un nor de cuvinte - o reprezentare grafică a tuturor cuvintelor din listă, arătând dimensiunea fiecărui cuvânt ca fiind proporțională la o valoare pe care o specificați. De exemplu, dacă aveți o foaie de calcul de cuvinte și întâmplări și doriți să identificați cele mai importante cuvinte, încercați un nor de cuvinte.
Nori de cuvinte lucrează deoarece datele majorității organizațiilor sunt text; un exemplu comun este utilizarea Twitter a termenilor de trend. Fiecare termen din această reprezentare are o pondere care afectează dimensiunea sa ca indicator al importanței sale relative.
O modalitate de a defini această greutate ar putea fi de câte ori apare un cuvânt în colecția de date. Cu cât apare mai frecvent un cuvânt, greutatea "mai grea" - și cu cât este mai mare în nor.
Cum se utilizează reprezentarea păsărilor flocking pentru analiza predictivă
Comportamentul natural de floculare este, în general, un sistem de auto-organizare în care obiectele (în particular, lucrurile vii) tind să se comporte în funcție de (a) mediul în care aparțin (b) răspunsurile lor la alte obiecte existente. Comportamentul flocking al societăților naturale, cum ar fi albinele, muștele, păsările, peștii și furnicile - sau, de altfel, oamenii - este, de asemenea, cunoscut sub numele de inteligență roșie .
Păsările urmează reguli naturale atunci când se comportă ca o turmă. Coabele sunt păsările situate la o anumită distanță unul față de celălalt; aceste păsări sunt considerate similare. Fiecare pasăre se deplasează în conformitate cu cele trei reguli principale care organizează comportamentul flocking.
-
Separare: Coabele nu trebuie să se ciocnească între ele.
-
Aliniere: Flock-mates pentru a muta în aceeași direcție medie ca vecinii lor.
-
Coeziune: Conlocuitorii se deplasează în funcție de poziția medie sau de locația partenerilor lor.
Modelarea acestor trei reguli poate permite unui sistem analitic să simuleze comportamentele flocking. Folosind comportamentul natural auto-organizat al păsărilor flocking, puteți transforma o foaie de calcul direct într-o vizualizare.Cheia este definirea noțiunii de similitudine ca parte a datelor dvs. Începeți cu câteva întrebări:
-
Ce face ca două date de date în datele dvs. să fie similare?
-
Care atribute pot conduce cel mai bine asemănarea dintre două înregistrări de date?
De exemplu, în datele rețelei sociale, înregistrările de date reprezintă utilizatori individuali; atributele care le descriu pot include vârsta, codul poștal, relația, lista de prieteni, numărul de prieteni, obiceiurile, evenimentele