Cuprins:
- Învățarea supravegheată
- Erori vă ajută să învățați deoarece au o pedeapsă adăugată (cost, pierdere de timp, regret, durere și așa mai departe), învățându-vă că un anumit mod de acțiune este mai puțin probabil să reușească decât alții. Un exemplu interesant de învățare a consolidării apare atunci când calculatoarele învață să joace singure jocuri video.
Video: CUM SA IEI PERMISUL AUTO DIN PRIMA USOR | AM CONDUS FARA PERMIS? 2024
Învățarea supravegheată
- Învățarea neaservată
- Învățarea pentru armare
- Învățarea supravegheată
Învățarea supravegheată
apare atunci când un algoritm află datele și răspunsurile țintă asociate care pot consta din valori numerice sau etichete de șir, cum ar fi clase sau etichete, pentru a anticipa mai târziu răspunsul corect atunci când este prezentat cu exemple noi. Abordarea supravegheată este într-adevăr similară cu cea a învățării umane sub supravegherea unui profesor. Profesorul oferă exemple bune pentru memorarea studentului, iar elevul obține reguli generale din aceste exemple specifice.
Învățare neaservată
apare atunci când un algoritm învață din exemple simple fără nici un răspuns asociat, lăsând algoritmului să determine modelele de date pe cont propriu. Acest tip de algoritm tinde să restructureze datele în altceva, cum ar fi noi caracteristici care pot reprezenta o clasă sau o nouă serie de valori necorelate. Ele sunt destul de utile pentru a oferi oamenilor o perspectivă asupra semnificației datelor și a unor noi intrări utile pentru algoritmii de învățare automată supravegheați.
Învățarea pentru armare
Învățarea pentru armare
apare atunci când prezentați algoritmul cu exemple care nu au etichete, ca în învățarea nesupravegheată. Cu toate acestea, puteți însoți un exemplu cu feedback pozitiv sau negativ în funcție de soluția propusă de algoritm.Învățarea prin armare este conectată la aplicații pentru care algoritmul trebuie să ia decizii (deci produsul este prescriptiv, nu doar descriptiv, ca în învățarea nesupravegheată), iar deciziile au consecințe. În lumea umană, este la fel ca învățarea prin încercare și eroare.
Erori vă ajută să învățați deoarece au o pedeapsă adăugată (cost, pierdere de timp, regret, durere și așa mai departe), învățându-vă că un anumit mod de acțiune este mai puțin probabil să reușească decât alții. Un exemplu interesant de învățare a consolidării apare atunci când calculatoarele învață să joace singure jocuri video.
În acest caz, o aplicație prezintă algoritmul cu exemple de situații specifice, cum ar fi jucătorul blocat într-un labirint evitând în același timp un inamic. Aplicația permite algoritmului să cunoască rezultatul acțiunilor necesare, iar învățarea are loc în timp ce încearcă să evite ceea ce descoperă pentru a fi periculos și pentru a urmări supraviețuirea. Puteți să aruncați o privire asupra modului în care compania Google DeepMind a creat un program de învățare a armăturilor, care redă jocurile video de la Atari. Când vizionați videoclipul, observați cum programul este inițial stângace și necalificat, dar se îmbunătățește constant cu antrenamentul până când devine campion.