Acasă Finanțe personale Cum se vizualizează analiza predictivă" date crude - manechine

Cum se vizualizează analiza predictivă" date crude - manechine

Cuprins:

Video: Qué es y cómo se hace un Análisis FODA - Planeación Estratégica - DOFA -SWOT 2024

Video: Qué es y cómo se hace un Análisis FODA - Planeación Estratégica - DOFA -SWOT 2024
Anonim

O imagine este în valoare de o mie de cuvinte - mai ales atunci când încercați să obțineți o bună manevră asupra datelor de analiză predictivă. La etapa de pre-procesare, în timp ce vă pregătiți datele, este o practică obișnuită de a vizualiza ceea ce aveți în mână înainte de a continua la pasul următor.

Începeți utilizând o foaie de calcul, cum ar fi Microsoft Excel, pentru a crea o matrice de date - care conține date (denumite și atribute ). Mai multe pachete software de business intelligence (cum ar fi Tableau) vă pot oferi o imagine de ansamblu preliminară a datelor la care sunteți pe punctul de a aplica analizele.

Cum se utilizează vizualizările tabulare pentru analiza predictivă

Tabelele reprezintă reprezentarea grafică cea mai simplă, cea mai de bază a datelor. Tabelele (cunoscute și sub numele de foi de calcul ) constau din rânduri și coloane - care corespund, respectiv, obiectelor și atributelor lor menționate anterior ca făcându-vă datele. De exemplu, luați în considerare datele privind rețelele sociale online. Un obiect de date ar putea reprezenta un utilizator. Atributele unui utilizator (obiect de date) pot fi titlurile coloanelor: Sex, Cod poștal sau Data nașterii.

Celulele dintr-un tabel reprezintă valori. Vizualizarea în tabele vă poate ajuta să identificați cu ușurință valorile atributelor lipsă ale obiectelor de date.

Tabelele pot oferi, de asemenea, flexibilitatea de a adăuga atribute noi care sunt combinații de alte atribute. De exemplu, în datele rețelei sociale, puteți adăuga o altă coloană numită Vârstă, care poate fi ușor calculată - ca atribut derivat - din atributul de dată de naștere existent. Datele din tabelul de rețea socială arată o nouă coloană, Vârsta, creată dintr-o altă coloană existentă (Data nașterii).

Diagrame utilizate în analiza predictivă

Graficele de bare pot fi folosite pentru a detecta spații sau anomalii ale datelor. Puteți să-l utilizați pentru fiecare atribut pentru a vizualiza rapid valorile minime și maxime. Bar graficele pot fi, de asemenea, utilizate pentru a începe o discuție despre modul de a normaliza datele.

Normalizarea este ajustarea unor valori ale atributelor sau ale tuturor atributelor pe o scară care face datele mai utile. De exemplu, puteți observa cu ușurință că există o eroare în date: Bara de vârstă a unei înregistrări este negativă. Această anomalie este mai ușor descrisă de o diagramă de bare decât de un tabel de date.

Elementele de bază ale diagramelor pieptene pentru analiza predictivă

Tabelele cu diagrame sunt folosite în principal pentru a arăta procente. Ele pot ilustra cu ușurință distribuția mai multor articole și evidențiază cele mai dominante. Datele brute ale rețelei sociale sunt reprezentate în funcție de atributul Age.Observați că graficul arată nu numai o distribuție clară a masculilor față de femei, ci și o eroare probabilă: R ca valoare pentru tipul de gen posibil creată atunci când datele au fost colectate.

Cum se utilizează grafice grafice pentru analiza predictivă

Teoria grafurilor oferă un set de algoritmi puternici care pot analiza datele structurate și reprezentate ca un grafic. În domeniul informaticii, un grafic este structura de date, o modalitate de a organiza date care reprezintă relațiile dintre perechi de obiecte de date. Un grafic este alcătuit din două părți principale:

  • Vertex, cunoscut și ca noduri

  • Margini care conectează perechi de noduri

Marginile pot fi direcționate (săgeată) și pot avea greutăți. Puteți decide să plasați o margine (săgeată) între două noduri (cercuri) - în acest caz, membrii rețelei sociale care sunt conectați la alți membri ca prieteni:

Direcția săgeții indică cine "prieteni", sau care inițiază interacțiunile de cele mai multe ori.

Elementele de bază ale norilor cuvântului pentru analiza predictivă

Luați în considerare o listă de cuvinte sau concepte aranjate ca un nor de cuvinte - o reprezentare grafică a tuturor cuvintelor din listă, arătând dimensiunea fiecărui cuvânt ca fiind proporțională la o valoare pe care o specificați. De exemplu, dacă aveți o foaie de calcul de cuvinte și întâmplări și doriți să identificați cele mai importante cuvinte, încercați un nor de cuvinte.

Nori de cuvinte lucrează deoarece datele majorității organizațiilor sunt text; un exemplu comun este utilizarea Twitter a termenilor de trend. Fiecare termen din această reprezentare are o pondere care afectează dimensiunea sa ca indicator al importanței sale relative.

O modalitate de a defini această greutate ar putea fi de câte ori apare un cuvânt în colecția de date. Cu cât apare mai frecvent un cuvânt, greutatea "mai grea" - și cu cât este mai mare în nor.

Cum se utilizează reprezentarea păsărilor flocking pentru analiza predictivă

Comportamentul natural de floculare este, în general, un sistem de auto-organizare în care obiectele (în particular, lucrurile vii) tind să se comporte în funcție de (a) mediul în care aparțin (b) răspunsurile lor la alte obiecte existente. Comportamentul flocking al societăților naturale, cum ar fi albinele, muștele, păsările, peștii și furnicile - sau, de altfel, oamenii - este, de asemenea, cunoscut sub numele de inteligență roșie .

Păsările urmează reguli naturale atunci când se comportă ca o turmă. Coabele sunt păsările situate la o anumită distanță unul față de celălalt; aceste păsări sunt considerate similare. Fiecare pasăre se deplasează în conformitate cu cele trei reguli principale care organizează comportamentul flocking.

  • Separare: Coabele nu trebuie să se ciocnească între ele.

  • Aliniere: Flock-mates pentru a muta în aceeași direcție medie ca vecinii lor.

  • Coeziune: Conlocuitorii se deplasează în funcție de poziția medie sau de locația partenerilor lor.

Modelarea acestor trei reguli poate permite unui sistem analitic să simuleze comportamentele flocking. Folosind comportamentul natural auto-organizat al păsărilor flocking, puteți transforma o foaie de calcul direct într-o vizualizare.Cheia este definirea noțiunii de similitudine ca parte a datelor dvs. Începeți cu câteva întrebări:

  • Ce face ca două date de date în datele dvs. să fie similare?

  • Care atribute pot conduce cel mai bine asemănarea dintre două înregistrări de date?

De exemplu, în datele rețelei sociale, înregistrările de date reprezintă utilizatori individuali; atributele care le descriu pot include vârsta, codul poștal, relația, lista de prieteni, numărul de prieteni, obiceiurile, evenimentele

Cum se vizualizează analiza predictivă" date crude - manechine

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...