Acasă Finanțe personale Elementele de bază ale modulelor K-Means și DBSCAN pentru analiza predictivă - dummy

Elementele de bază ale modulelor K-Means și DBSCAN pentru analiza predictivă - dummy

Video: Xiaomi Black Shark 2 | Încă un telefon de GAMING? | Unboxing & Review CEL.ro 2024

Video: Xiaomi Black Shark 2 | Încă un telefon de GAMING? | Unboxing & Review CEL.ro 2024
Anonim

Învățarea neaservată are multe provocări în ceea ce privește analiza predictivă - inclusiv neștiind ce să ne așteptăm când executați un algoritm. Fiecare algoritm va produce rezultate diferite; nu vei fi niciodată sigur dacă un rezultat este mai bun decât celălalt - sau chiar dacă rezultatul are valoare.

Când știți ce ar trebui să fie rezultatele, puteți optimiza algoritmii pentru a obține rezultatele dorite. În seturile de date din lumea reală, nu veți avea acest lux. Va trebui să depindeți de cunoștințele anterioare ale datelor - sau de intuiție - pentru a decide care parametri și algoritmi de inițializare să le utilizați pe măsură ce creați modelul.

Cu toate acestea, în cadrul unor activități de învățare reale nesupravegheate, aceste cunoștințe anterioare nu sunt disponibile și rezultatul dorit este greu de găsit. Alegerea numărului corect de clustere este problema cheie. Dacă întâmpinați numărarea corectă a clusterelor, datele dvs. vor genera informații pe care le puteți face predicții foarte precise. Pe de altă parte, ghicitul numărului greșit de clustere poate genera rezultate parțiale.

Gândiți-vă la

date separabile liniar ca un grup de puncte într-un grafic care poate fi separat folosind o linie dreaptă. Dacă datele nu pot fi separate liniar, vor fi folosite mai multe versiuni avansate ale mijloacelor K - care vor deveni mai computerizate și ar putea să nu fie potrivite pentru seturi de date foarte mari. În implementarea sa standard, complexitatea de a calcula centrele de clustere și distanțele este redusă.

K-mijloacele sunt utilizate pe scară largă pentru a rezolva probleme mari de date, deoarece sunt simple de utilizat, eficiente și foarte scalabile. Nu e de mirare că majoritatea furnizorilor comerciali folosesc algoritmul K-means ca o componentă cheie a pachetelor lor de predicție analitică.

Implementarea aplicației DBSCAN (Density-Based Clustering of Applications with Noise) în scikit-learn nu necesită parametri de inițializare definiți de utilizator pentru a crea o instanță. Aveți posibilitatea să înlocuiți parametrii impliciți în timpul inițializării, dacă doriți. Din păcate, dacă utilizați parametrii impliciți, algoritmul nu poate oferi o potrivire apropiată cu rezultatul dorit.

DBSCAN este mai potrivit pentru seturile de date care au dimensiuni disproporționate de cluster și ale căror date pot fi separate într-un mod neliniar.Ca și în cazul mijloacelor K, DBSCAN este scalabil, dar utilizarea acestuia pe seturi de date foarte mari necesită mai multă memorie și putere de calcul.

Elementele de bază ale modulelor K-Means și DBSCAN pentru analiza predictivă - dummy

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...