Video: Statistical Programming with R by Connor Harris 2024
Minerii de date lucrează repede. Pentru a obține viteză, va trebui să folosiți instrumentele adecvate și să descoperiți trucurile comerțului. Cel mai bun instrument de extragere a datelor este creierul dvs., cu un pic de know-how. Al doilea instrument cel mai bun este o aplicație de extragere a datelor cu o interfață de programare vizuală.
Cu programare vizuală, pașii din procesul dvs. de lucru sunt reprezentați de imagini mici pe care le organizați pe ecran pentru a crea o imagine a fluxului și logicii muncii dvs. Programarea vizuală face mai ușor să vedeți ce faceți în mai mulți pași decât ar fi cu comenzile (programarea) sau cu meniurile convenționale.
În acest exemplu, puteți vedea procesul de lucru în zona principală a aplicației de extragere a datelor. În jurul acestuia sunt meniuri de proiecte recente, instrumente pentru funcții de extragere a datelor, un vizualizator care vă ajută să navigați în procese complexe și un jurnal. Aceste detalii variază puțin de la un produs la altul.
Uită-te mai îndeaproape la proces. Deși vă aflați în căutarea de a fi un miner de date, probabil că puteți înțelege multe din ceea ce se întâmplă doar dacă vă uitați la această diagramă, inclusiv următoarele:
-
Puteți vedea CSV Reader. Dacă știți despre. csv (valori separate prin virgule), probabil că deja știți că este vorba despre importul de date. (Și este primul pas, aveți nevoie de date pentru a face orice altceva.)
-
Apoi, veți vedea unelte clar etichetate de funcții precum Redenumirea coloanei și Strip Manipulation. Acestea sunt etapele de pregătire a datelor.
-
Arborele elevilor ar putea fi misterios dacă sunteți nou în modelare, dar acest instrument creează un model arbore de decizie dintr-un subset de date.
-
Pașii finali aplică modelul pentru datele care au fost păstrate separate pentru testare și pentru a efectua anumite tehnici de evaluare.