Video: The puzzle of motivation | Dan Pink 2025
În analiza supravegheată, și rezultatele preferate fac parte din datele de instruire. Modelul de analiză predictivă este prezentat cu rezultatele corecte ca parte a procesului său de învățare. O astfel de învățare supravegheată presupune exemple pre-clasificate: Scopul este de a determina modelul să învețe din clasificarea cunoscută anterior, astfel încât să poată eticheta corect următorul punct de date necunoscut pe baza a ceea ce a învățat.
Când pregătirea modelului este completă, o funcție matematică este dedusă prin examinarea datelor de antrenament. Această funcție va fi utilizată pentru a marca noi puncte de date.
Pentru ca această abordare să funcționeze corect, datele de antrenament - împreună cu datele de testare - trebuie selectate cu atenție. Modelul instruit ar trebui să poată anticipa rapid și precis eticheta corectă pentru un nou punct de date, pe baza tipului de date pe care modelul le-a văzut în datele de antrenament.
Analizele supravegheate oferă câteva avantaje distincte:
-
Analistul este responsabil de proces.
-
Etichetarea se bazează pe clasificări cunoscute.
-
Erorile de etichetare pot fi rezolvate cu ușurință.
Partea inversă a acestor avantaje este un set identic de dezavantaje potențiale:
-
Orice greșeală din faza de antrenament va fi consolidată mai târziu.
-
Clasificarea furnizată de analist nu poate descrie în mod corespunzător întreaga populație.
-
Este posibil ca modelul să nu poată detecta clasele care se abat de la setul original de antrenament.
-
Presupunerea că clusterele din cadrul datelor nu se suprapun - și că ele pot fi ușor separate - nu se dovedesc valide.
