3 Tipuri de învățare în mașină - dummy

Video: CUM SA IEI PERMISUL AUTO DIN PRIMA USOR | AM CONDUS FARA PERMIS? 2024

< Învățarea în mașină are multe arome diferite, în funcție de algoritm și obiectivele sale. Puteți să împărțiți algoritmii de învățare a mașinilor în trei grupe principale în funcție de scopul lor:

Învățarea supravegheată

Învățarea neaservată
Învățarea pentru armare
Învățarea supravegheată

Învățarea supravegheată

apare atunci când un algoritm află datele și răspunsurile țintă asociate care pot consta din valori numerice sau etichete de șir, cum ar fi clase sau etichete, pentru a anticipa mai târziu răspunsul corect atunci când este prezentat cu exemple noi. Abordarea supravegheată este într-adevăr similară cu cea a învățării umane sub supravegherea unui profesor. Profesorul oferă exemple bune pentru memorarea studentului, iar elevul obține reguli generale din aceste exemple specifice.

Trebuie să faceți o distincție între problemele de regresie, a căror țintă este o valoare numerică și problemele de clasificare, a căror țintă este o variabilă calitativă, cum ar fi o clasă sau o etichetă. O sarcină de regresie determină prețurile medii ale locuințelor din zona Boston, iar o sarcină de clasificare face distincția între tipurile de flori de iris bazate pe măsurile sepale și petale.

Învățare neaservată

apare atunci când un algoritm învață din exemple simple fără nici un răspuns asociat, lăsând algoritmului să determine modelele de date pe cont propriu. Acest tip de algoritm tinde să restructureze datele în altceva, cum ar fi noi caracteristici care pot reprezenta o clasă sau o nouă serie de valori necorelate. Ele sunt destul de utile pentru a oferi oamenilor o perspectivă asupra semnificației datelor și a unor noi intrări utile pentru algoritmii de învățare automată supravegheați.
Învățarea pentru armare
Învățarea pentru armare

apare atunci când prezentați algoritmul cu exemple care nu au etichete, ca în învățarea nesupravegheată. Cu toate acestea, puteți însoți un exemplu cu feedback pozitiv sau negativ în funcție de soluția propusă de algoritm.Învățarea prin armare este conectată la aplicații pentru care algoritmul trebuie să ia decizii (deci produsul este prescriptiv, nu doar descriptiv, ca în învățarea nesupravegheată), iar deciziile au consecințe. În lumea umană, este la fel ca învățarea prin încercare și eroare.

Erori vă ajută să învățați deoarece au o pedeapsă adăugată (cost, pierdere de timp, regret, durere și așa mai departe), învățându-vă că un anumit mod de acțiune este mai puțin probabil să reușească decât alții. Un exemplu interesant de învățare a consolidării apare atunci când calculatoarele învață să joace singure jocuri video.

În acest caz, o aplicație prezintă algoritmul cu exemple de situații specifice, cum ar fi jucătorul blocat într-un labirint evitând în același timp un inamic. Aplicația permite algoritmului să cunoască rezultatul acțiunilor necesare, iar învățarea are loc în timp ce încearcă să evite ceea ce descoperă pentru a fi periculos și pentru a urmări supraviețuirea. Puteți să aruncați o privire asupra modului în care compania Google DeepMind a creat un program de învățare a armăturilor, care redă jocurile video de la Atari. Când vizionați videoclipul, observați cum programul este inițial stângace și necalificat, dar se îmbunătățește constant cu antrenamentul până când devine campion.