Acasă Finanțe personale Construi pe Scatterplots de bază - manechine

Construi pe Scatterplots de bază - manechine

Video: Statistical Programming with R by Connor Harris 2024

Video: Statistical Programming with R by Connor Harris 2024
Anonim

mineri de date multe ori să profite de caracteristici speciale pentru a împacheta mai multe informații în diagrame simple. Etichetele, suprapunerile și selecția interactivă sunt semne distinctive ale aplicațiilor de extragere a datelor, caracteristici speciale care vă permit să fiți mai productivi.

Kilometrajul scade pe măsură ce crește puterea de cai, după cum se vede în figura următoare.

Kilometrajul crește cu timpul, după cum puteți vedea, un scatterplot de kilometraj față de anul modelului. Ar fi de ajutor să obțineți aceste două idei într-un singur grafic.

date comun miniere abordări pentru integrarea mai mult de două variabile într-un grafic includ

  • Etichete: Etichetele sunt valori ale unui șir de caractere sau variabile categorice care au fost suprapuse pe grafică difuzată. Următoarea figură prezintă un scatterplot etichetat cu anul modelului mașinii.

    Seturile de date cu multe puncte sau etichete lungi pot face ca aceste diagrame să nu fie citite, totuși! Soluția este de a utiliza doar un eșantion de date. Configurația pentru acest tip de eșantionare este prezentată în figura următoare.

  • Suprapuneri: Cu suprapuneri, valorile unei variabile categorice definesc forma sau culoarea punctelor. Următoarea figură arată setarea pentru un model de scatterplot pentru a suprapune anul modelului pe scatterplot-ul kilometraj-versus-putere.

    Scatterplotul suprapus existent apare în următoarea imagine. Poate fi mai ușor să citești suprapunerile de culori decât suprapunerile în formă de punct. Setarea este de obicei la fel.

Un alt lucru pe care să-l țineți cont de scatterplots: Este posibil să aveți mai multe puncte care se încadrează în același loc! Dacă da, este posibil să nu puteți spune un punct pentru un caz dintr-un punct pentru 100 de cazuri. Remedierea este pentru a verifica o opțiune pentru a face mai multe instanțe vizibile. Căutați dimensiunea punctului sau bruiaj (mutați punctele ușor de pe locurile lor reale pentru a le face să fie vizibile).

Scatterplots interactiv sunt minunate de timp pentru mineri de date.

Spuneți că vedeți un grup interesant de cazuri într-un grafic și doriți să investigați mai departe doar acele cazuri. Dacă vă uitați la doar unul sau două puncte, ați putea obține informațiile pe care le doriți prin plasarea în mișcare, dar acest lucru nu este satisfăcător atunci când vă interesează mai mult de câteva puncte.

Instrumentele de selectare a datelor în scatterplot interactiv vă oferă mai multă putere de selectare a datelor. Următoarea figură prezintă aceeași configurare grafică, dar cu un grup de puncte selectat prin clic și tragerea mouse-ului în jurul lor. Aceasta nu este doar o caracteristică vizuală.

Puteți exporta punctele selectate ca un nou set de date. Acest lucru este foarte util și rapid!

Dacă punctele de care aveți nevoie nu se potrivesc frumos într-o selecție dreptunghiulară, aveți alte opțiuni. Consultați zona de mărire / selectare. Puteți vedea un buton cu un dreptunghi pentru selectarea dreptunghiulară și altul cu o formă rotundă pentru selectarea formei libere.

Iată un exemplu de selecție a formei libere, care utilizează date despre conținutul de nicotină din țigările vândute în diferite părți ale lumii. Acest scatterplot arată nicotină pe țigară pentru probe din cele șase regiuni ale Națiunilor Unite. (Aceasta este o utilizare netradițională a unui scatterplot, deoarece regiunea nu este o variabilă continuă, este categorică. Minerii de date folosesc adesea unelte tradiționale în moduri netradiționale.)

Punctele dintr-o regiune nu se încadrează într-o linie verticală perfectă. Schimbările mici (jitter) la stânga și la dreapta sunt făcute doar pentru citire și aspect. Câteva țigări au niveluri excepționale de nicotină și doriți să le selectați.

Un meniu derulant oferă opțiuni de selecție. Selecția poligonală vă permite să marcați o zonă liberă pe scatterplot.

Pentru a marca, faceți clic pe grafic pentru a crea un punct de pornire, apoi faceți clic din nou și din nou în jurul grupului de puncte dorit până când veți obține forma dorită.

Un clic dreapta indică faptul că ați terminat selecția; acest lucru este vizibil din evidențierea graficului.

Construi pe Scatterplots de bază - manechine

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...