Acasă Finanțe personale Faza 4 a procesului CRISP-DM Model: modeling

Faza 4 a procesului CRISP-DM Model: modeling

Cuprins:

Video: Śmierć w doświadczeniu jednostki i społeczeństwa.Ostroska .R.4.OSTATNIA FAZA ŻYCIA-PROCES UMIERANIA. 2024

Video: Śmierć w doświadczeniu jednostki i społeczeństwa.Ostroska .R.4.OSTATNIA FAZA ŻYCIA-PROCES UMIERANIA. 2024
Anonim

Modelarea face parte din procesul procesului standard de procesare a datelor din industrie (CRISP-DM) minerii ca cel mai bun. Datele dvs. sunt deja în formă bună și acum puteți căuta modele utile în datele dvs.

Faza de modelare include patru sarcini. Acestea sunt

  • Selectarea tehnicilor de modelare

  • Proiectarea testării

  • Modelul clădirii

  • Evaluarea modelelor

Sarcina: Selectarea tehnicilor de modelare

Lumea minunată a minelor de date oferă oudele tehnicilor de modelare, dar nu toate se vor potrivi nevoilor dvs. Reduceți lista pe baza tipurilor de variabile implicate, a selecției tehnicilor disponibile în instrumentele dvs. și a oricăror considerente de afaceri importante pentru dvs.

De exemplu, multe organizații favorizează metode cu o ieșire ușor de interpretat, deci arborii de decizie sau regresia logistică ar putea fi acceptabili, dar rețelele neuronale probabil că nu vor fi acceptate.

Produsele pentru această sarcină includ două rapoarte:

  • Tehnica de modelare: Specificați tehnica (tehnicile) pe care o veți folosi.

  • Ipoteze de modelare: Multe tehnici de modelare se bazează pe anumite ipoteze. De exemplu, un tip de model poate fi destinat utilizării cu date care au un anumit tip de distribuție. Documentați aceste ipoteze în acest raport.

Statisticienii sunt bine informați, stricți și agitați despre ipoteze. Acest lucru nu este neapărat adevărat pentru minerii de date și nu este o cerință de a deveni un miner de date. Dacă aveți cunoștințe statistice profunde și înțelegeți ipotezele din spatele modelelor pe care le selectați, puteți fi stricte și agitate în legătură cu ipotezele.

Dar mulți mineri de date, în special minerii de date novice, nu se amestecă mult peste ipoteze. Alternativa este testarea - multe și multe teste - a modelelor tale.

Sarcina: Proiectarea testelor

Testul din această sarcină este testul pe care îl veți utiliza pentru a determina cât de bine funcționează modelul dvs. Poate fi la fel de simplu ca și împărțirea datelor într-un grup de cazuri pentru formarea de modele și un alt grup pentru testarea modelului.

Datele de antrenament sunt folosite pentru a potrivi formularele matematice cu modelul de date, iar datele de testare sunt folosite în timpul procesului de formare a modelului pentru a evita suprasolicitarea : făcând un model perfect pentru un set de date, dar nu și altul. De asemenea, puteți utiliza datele holdout, care nu sunt utilizate în timpul procesului de formare a modelului, pentru un test suplimentar.

Livrarea pentru această sarcină este design-ul testelor. Nu este nevoie să fie elaborată, dar ar trebui cel puțin să aveți grijă ca datele dvs. de antrenament și de testare să fie similare și să evitați introducerea oricărei părtinitoare în date.

Sarcina: Modelul (modelele) de construcție

Modelarea este ceea ce mulți oameni își imaginează a fi întreaga slujbă a minerului de date, dar este doar o sarcină de zeci! Cu toate acestea, modelarea pentru a atinge obiectivele de afaceri specifice este inima profesiei de date miniere.

Produsele pentru această sarcină includ trei elemente:

  • Setările parametrilor: Atunci când construiți modele, majoritatea instrumentelor vă oferă posibilitatea de a regla o varietate de setări și aceste setări au un impact asupra structurii modelului final. Documentați aceste setări într-un raport.

  • Descrieri de model: Descrieți modelele. Specificați tipul de model (cum ar fi regresia liniară sau rețeaua neuronală) și variabilele utilizate. Explicați modul în care este interpretat modelul. Documentați dificultățile întâmpinate în procesul de modelare.

  • Modele: Acest produs este singurul model. Unele tipuri de modele pot fi ușor de definit printr-o simplă ecuație; altele sunt prea complexe și trebuie transmise într-un format mai sofisticat.

Sarcina: Evaluarea modelului (modelelor)

Acum veți examina modelele pe care le-ați creat, din punct de vedere tehnic și din punct de vedere al afacerii (adesea cu ajutorul experților de afaceri din echipa de proiect).

Produsele pentru această sarcină includ două rapoarte:

  • Evaluarea modelului: Sumarizează informațiile dezvoltate în revizuirea modelului. Dacă ați creat mai multe modele, le puteți clasifica pe baza evaluării valorii lor pentru o anumită aplicație.

  • Setări revizuite ale parametrilor: Puteți alege să ajustați setările care au fost utilizate pentru a construi modelul și pentru a efectua o nouă rundă de modelare și pentru a încerca să vă îmbunătățiți rezultatele.

Exploatarea datelor, ca o ceapă, un torță Dobos sau o rocă sedimentară, are multe straturi. Când începeți să vă aflați în mintea datelor, puteți începe prin a lăsa setările parametrilor la valorile lor implicite (de fapt, este posibil să nu observați opțiuni decât dacă încercați să le căutați).

Pe măsură ce vă simțiți confortabil în noua carieră de date miniere, veți avea sens să aflați despre parametrii modelului și să știți cum puteți să îi folosiți. Opțiunile dvs. vor varia foarte mult în funcție de tipul de model și de instrumentul specific pe care îl utilizați.

Faza 4 a procesului CRISP-DM Model: modeling

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...