Acasă Finanțe personale Optimizarea opțiunilor de validare încrucișată în mașină de învățare

Optimizarea opțiunilor de validare încrucișată în mașină de învățare

Video: START LUCRĂRI DE EFICIENTIZARE ENERGETICĂ LA LICEUL TEORETIC ” TUDOR VIANU” 2024

Video: START LUCRĂRI DE EFICIENTIZARE ENERGETICĂ LA LICEUL TEORETIC ” TUDOR VIANU” 2024
Anonim

Capacitatea de a valida o ipoteză de învățare a mașinii permite în mod eficient optimizarea algoritmului ales. Algoritmul oferă cea mai mare parte a performanței predictive a datelor dvs., având în vedere capacitatea sa de a detecta semnalele de la date și de a se potrivi cu forma adevărată funcțională a funcției de predicție fără a suprasolicita și a genera o mare varietate a estimărilor. Nu fiecare algoritm de învățare a mașinii este cel mai potrivit pentru datele dvs. și nici un algoritm unic nu poate să se potrivească fiecărei probleme. Depinde de dvs. să găsiți cea potrivită pentru o anumită problemă.

O a doua sursă de performanță predictivă este datele în sine transformate și selectate corespunzător pentru a spori capacitățile de învățare ale algoritmului ales.

Sursa finală de performanță derivă din reglarea fină a algoritmilor hiper-parametrii, care sunt parametrii pe care îi decideți înainte de învățare și care nu sunt învățați din date. Rolul lor este definirea unei ipoteze a priori, în timp ce alți parametri îi specifică a posteriori, după ce algoritmul interacționează cu datele și, folosind un proces de optimizare, constată că anumite valori ale parametrilor să lucreze mai bine în obținerea unor previziuni bune.

Algoritmii complexe de învățare a mașinilor, cei mai expuși variației estimărilor, prezintă multe opțiuni exprimate într-un număr mare de parametri. Răsturnarea cu ele îi face să se adapteze mai mult sau mai puțin la datele pe care le învață. Uneori, prea mult hiper-parametru twiddling poate face chiar algoritmul detecta semnale false de la date. Acest lucru face ca parametrii hiper-parametri să fie o sursă de varianță nedetectată dacă începeți să le manipulați prea mult pe baza unor referințe fixe, cum ar fi un set de test sau o schemă de validare încrucișată repetată.

Atât R, cât și Python oferă funcționalități de tăiere care taie matricea de intrare în părți de tren, test și validare. În special, pentru proceduri mai complexe de testare, cum ar fi validarea încrucișată sau bootstrapping, pachetul Scikit-learn oferă un întreg modul și R are un pachet specializat, oferind funcții pentru divizarea datelor, preprocesarea și testarea.Acest pachet se numește îngrijire.

Posibilele combinații de valori care pot forma hiper-parametrii fac să se decidă unde să căutați greu optimizările. Așa cum este descris atunci când se discută despre coborârea gradientului, un spațiu de optimizare poate conține combinații de valori care se comportă mai bine sau mai rău. Chiar și după ce găsiți o combinație bună, nu sunteți siguri că este cea mai bună opțiune. (Aceasta este problema lipirii în minimele locale la minimizarea erorii.)

Ca modalitate practică de a rezolva această problemă, cea mai bună modalitate de a verifica hiper-parametrii pentru un algoritm aplicat datelor specifice este de a le testa pe toate validare încrucișată și pentru a alege cea mai bună combinație. Această abordare simplă, numită grilă, oferă avantaje incontestabile, permițându-vă să precizați gama de valori posibile pentru a introduce sistematic în algoritm și pentru a detecta când se întâmplă minimul general.

Pe de altă parte, căutarea în rețea are de asemenea dezavantaje serioase, deoarece este intensivă din punct de vedere computațional (puteți efectua cu ușurință această sarcină în paralel pe computerele moderne multicore) și destul de consumatoare de timp. Mai mult decât atât, testele sistematice și intensive sporesc posibilitatea de a suferi erori deoarece unele rezultate bune, dar false de validare pot fi cauzate de zgomotul prezent în setul de date.

Unele alternative la căutarea în rețea sunt disponibile. În loc să testați totul, puteți încerca să explorați spațiul posibilelor valori hiper-parametrice ghidate de tehnicile de optimizare neliniară computațional grele și complexe matematic (cum ar fi metoda Nelder-Mead), utilizând o abordare Bayesiană (unde numărul de teste este minimizat prin luarea avantajul rezultatelor anterioare) sau folosind căutarea aleatorie.

În mod surprinzător, căutarea la întâmplare funcționează incredibil de bine, este ușor de înțeles și nu se bazează numai pe norocul orb, deși pare să fie inițial. De fapt, punctul principal al tehnicii este că, dacă alegeți suficiente teste aleatorii, aveți de fapt suficiente posibilități pentru a arăta parametrii potriviți fără a pierde energia la testarea unor combinații ușor diferite de combinații similare.

Reprezentarea grafică de mai jos explică de ce rezultatele aleatorii funcționează bine. O explorare sistematică, deși utilă, tinde să testeze fiecare combinație, ceea ce se transformă într-o risipă de energie dacă unii parametri nu influențează rezultatul. O căutare aleatorie testează mai puține combinații, dar mai mult în intervalul fiecărui hyper-parametru, o strategie care se dovedește a fi câștigătoare dacă, așa cum se întâmplă deseori, anumiți parametri sunt mai importanți decât alții.

Compararea căutării în rețea cu căutarea aleatorie.

Pentru ca o căutare aleatorie să funcționeze bine, ar trebui să faceți de la 15 până la maximum 60 de teste. Are sens să recurgă la o căutare aleatorie dacă o căutare în rețea necesită un număr mai mare de experimente.
Optimizarea opțiunilor de validare încrucișată în mașină de învățare

Alegerea editorilor

Administrator de rețea: Zone de căutare inversă - dummies

Administrator de rețea: Zone de căutare inversă - dummies

Interogări DNS obișnuite sunt interogări de căutare înainte corespunde unui nume de domeniu complet calificat. O căutare inversă este opusul unei căutări forward: returnează numele de domeniu complet calificat al unei gazde pe baza adresei sale IP. Căutările inverse sunt posibile din cauza unui domeniu special numit ...

Rețea Elemente de bază: Clienți și servere - manechine

Rețea Elemente de bază: Clienți și servere - manechine

Computerul de rețea care conține hard disk-urile, imprimantele și alte resurse care sunt partajate cu alte calculatoare de rețea se numește un server. Acest termen vine în repetate rânduri, deci trebuie să-l amintiți. Scrie-o pe spatele mâinii tale stângi. Orice computer care nu este un server este numit client. Aveți ...

Retea Bazele: Poduri - dummies

Retea Bazele: Poduri - dummies

O punte este un dispozitiv care conecteaza doua retele astfel incat sa actioneze ca si cum ar fi o rețea. Podurile sunt utilizate pentru a împărți o rețea mare în două rețele mai mici din motive de performanță. Vă puteți gândi la un pod ca pe un repetor inteligent. Repetoarele ascultă semnale care coboară pe un cablu de rețea, amplifică ...

Alegerea editorilor

ÎMprumuta și tweak idei de la alte comunități online - dummies

ÎMprumuta și tweak idei de la alte comunități online - dummies

, Mai degrabă decât să ia ideile altcuiva complet pentru dvs. comunitate online, încercați să riffați pe aceeași idee, dar nu atât de mult încât este evident că nu sunteți creierul din spatele brainstorming-ului. Idei sunt acolo pentru a lua, dar nu ar fi mai degrabă văzute ca cineva inovatoare, nu cineva care scours pe web ...

Branding Blogul tău

Branding Blogul tău

Branding blog-ul tău merge mult spre a face dacă este ușor de recunoscut pentru cititorii tăi. Când vedeți un punct roșu în interiorul unui cerc roșu, ce magazin vine în minte? Ce zici de acele arcuri de aur? Un nume de marcă apare în minte atunci când vedeți simbolul swoosh? La fel ca magazinele populare, restaurantele și încălțămintea ...

Construiți un Blog Mama care este Sellable - dummies

Construiți un Blog Mama care este Sellable - dummies

Dacă obiectivul pe termen lung este de a vinde blogul dvs. ar trebui să o construiască cu acest scop în minte. Evitați asocierea prea intensă a blogului cu marca dvs. personală. Un blog care poate fi valoros cu orice scriitor la cârma trebuie să îndeplinească majoritatea, dacă nu toate, următoarele criterii: Blogul este concentrat ...

Alegerea editorilor

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

Cum să creați o nouă campanie de anunțuri LinkedIn - dummies

LinkedIn oferă servicii de publicitate pentru afacerea dvs. Dacă vă decideți să utilizați LinkedIn ca instrument de marketing, va trebui doar să obțineți o nouă campanie de anunțuri în lucrări. Când sunteți gata să începeți o nouă campanie, urmați acești pași:

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Opțiuni de filtrare pentru anunțul dvs. LinkedIn - manechine

Ce opțiuni de filtrare aveți pentru anunțul dvs. LinkedIn? Alte rețele de publicitate vă permit să filtrați publicul vizat de câteva atribute cunoscute ale persoanei care vă va vedea anunțul, sexul și locația membrilor din public. LinkedIn vă permite să faceți un pas mai departe permițându-vă ...

Oferind și primind viziuni pe LinkedIn - manechine

Oferind și primind viziuni pe LinkedIn - manechine

Deși mulți oameni cred că "Nu este ceea ce știi, știi, "care este unul dintre principalele motive pentru care LinkedIn este atât de valoros, mulți oameni (recrutorii, angajații, directorii executivi, investitorii și altele) sunt foarte interesați de ceea ce știi. În mod logic, oamenii care vă cunosc cel mai bine sunt oamenii din rețeaua dvs., care ...