Acasă Finanțe personale Cunoașterea limitelor de bias în procesul de învățare în mașină - dummy

Cunoașterea limitelor de bias în procesul de învățare în mașină - dummy

Video: ZEITGEIST: MOVING FORWARD | OFFICIAL RELEASE | 2011 2024

Video: ZEITGEIST: MOVING FORWARD | OFFICIAL RELEASE | 2011 2024
Anonim

Învățarea în mașină depinde foarte mult de datele din eșantion. Această parte a datelor dvs. este importantă deoarece doriți să descoperiți un punct de vedere al lumii și, ca și în toate punctele de vedere, poate fi greșit, distorsionat sau doar parțial. Știți, de asemenea, că aveți nevoie de un exemplar extras din exemplul pentru a verifica dacă procesul de învățare funcționează. Cu toate acestea, aceste aspecte nu constituie decât o parte a imaginii.

Atunci când faci un algoritm de învățare a mașinilor să lucrezi cu date pentru a ghici un anumit răspuns, ești în mod efectiv un joc de noroc și acest joc de noroc nu este doar din cauza eșantionului pe care îl folosești pentru învățare. Mai este. Pentru moment, imaginați-vă că aveți liber acces la date potrivite, imparțiale, în eșantion, deci datele nu sunt problema. În schimb, trebuie să vă concentrați asupra metodei de învățare și predicție.

Mai întâi, trebuie să vă gândiți că pariați că algoritmul poate ghici în mod rezonabil răspunsul. Nu puteți face întotdeauna această presupunere deoarece găsirea anumitor răspunsuri nu este posibilă indiferent de ceea ce știți în avans.

De exemplu, nu puteți determina pe deplin comportamentul ființelor umane prin cunoașterea istoriei și comportamentului lor anterior. Poate că un efect aleatoriu este implicat în procesul generativ al comportamentului nostru (de exemplu, partea irațională a noastră) sau poate că problema se reduce la voința liberă (problema este de asemenea filozofică / religioasă și există multe opinii discordante). În consecință, puteți ghici doar câteva tipuri de răspunsuri, iar pentru multe altele, cum ar fi atunci când încercați să anticipați comportamentul oamenilor, trebuie să acceptați un anumit grad de incertitudine care, cu noroc, este acceptabil pentru scopurile dvs.

În al doilea rând, trebuie să considerați că pariați că relația dintre informațiile pe care le aveți și răspunsul pe care doriți să le preziceți poate fi exprimată ca o formulă matematică de un fel și că procesul dvs. de învățare algoritmul este de fapt capabil să ghicească această formulă. Capacitatea algoritmului de a ghici formula matematică din spatele unui răspuns este intrinsec înglobată în piulițele și bolțurile algoritmului.

Unii algoritmi pot ghici aproape totul; altele au de fapt un set limitat de opțiuni. Gama de formulări matematice posibile pe care un algoritm le poate ghici este setul de ipoteze posibile. În consecință, o ipoteză este un singur algoritm specificat în toți parametrii săi și, prin urmare, capabil de o singură formulare specifică.

Matematica este fantastică. Poate descrie o mare parte din lumea reală folosind o notație simplă și este nucleul învățării mecanice, deoarece orice algoritm de învățare are o anumită capacitate de a reprezenta o formulă matematică.Unele algoritmi, cum ar fi regresia liniară, utilizează în mod explicit o formulă matematică specifică pentru a reprezenta modul în care un răspuns (de exemplu, prețul unei case) se referă la un set de informații predictive (cum ar fi informațiile despre piață, locația locuinței, si asa mai departe).

Unele formulări sunt atât de complexe și complexe încât, deși le reprezintă pe hârtie, este posibil ca acest lucru să fie prea dificil din punct de vedere practic. Unii alți algoritmi sofisticați, cum ar fi copacii de decizie, nu au o formulă matematică explicită, dar sunt atât de adaptabili încât pot fi stabiliți cu ușurință pentru a aproxima o gamă largă de formulări. Ca exemplu, luați în considerare o formulă simplă și ușor explicată. Regresia liniară este doar o linie într-un spațiu de coordonate dat de răspuns și toți predictorii. În exemplul cel mai simplu, puteți avea un răspuns, y și un predictor unic, x, cu o formulare

y = β 1 x 1 + β < 0 Într-o situație simplă a unui răspuns anticipat de o singură caracteristică, un astfel de model este perfect atunci când datele dvs. se aranjează ca o linie. Cu toate acestea, ce se întâmplă dacă nu se face și în schimb se modelează ca o curbă? Pentru a reprezenta situația, trebuie doar să observați următoarele reprezentări bidimensionale.

Exemplu de model linear care se luptă pentru a mapa o funcție a curbei.

Atunci când punctele seamănă cu o linie sau cu un nor, se întâmplă o eroare atunci când observi că rezultatul este o linie dreaptă; prin urmare, cartografia furnizată de formularea precedentă este într-un fel imprecisă. Cu toate acestea, eroarea nu apare sistematic, ci mai degrabă în mod aleatoriu, deoarece unele puncte sunt deasupra liniei mapate, iar altele sunt sub ea. Situația cu norul curbat și format de puncte este diferită, pentru că de această dată linia este uneori exactă, dar în alte momente este sistematic greșită. Uneori punctele sunt întotdeauna deasupra liniei; uneori sunt sub el.

Având în vedere simplitatea cartografierii răspunsului, algoritmul dvs. tinde să supraestimeze sau să subestimeze în mod sistematic regulile reale din spatele datelor, reprezentând părtinirea sa. Părăsirea este caracteristică unor algoritmi simpli care nu pot exprima formulări matematice complexe.

Cunoașterea limitelor de bias în procesul de învățare în mașină - dummy

Alegerea editorilor

Cum se utilizează Pinterest pentru marketingul social vizuale - dummies

Cum se utilizează Pinterest pentru marketingul social vizuale - dummies

Multe companii folosesc Pinterest ca parte a strategiile lor de marketing media sociale vizuale. Este un site puternic de marketing social media, deoarece are o bază de utilizatori mare care petrece mult timp pe site. Întreprinderile folosesc Pinterest din mai multe motive, pentru a construi conștiința: Pinterest este un instrument util pentru ...

Cum să utilizați Pinterest pentru a vă direcționa traficul către site-ul companiei dvs. - manechine

Cum să utilizați Pinterest pentru a vă direcționa traficul către site-ul companiei dvs. - manechine

Unele dintre celelalte rețele sociale emergente, este ceva de care cineva care comercializează o marcă trebuie să ia în serios. Știați că Pinterest conduce mai mult trafic la blogurile și site-urile individuale decât YouTube, Google+ și LinkedIn combinate? Aceasta este o forță care trebuie luată în calcul. Iată cum funcționează fluxul de trafic. Dacă urmăriți corect ...

Alegerea editorilor

Cum să creezi diferite moduri de a spune același lucru - dummies

Cum să creezi diferite moduri de a spune același lucru - dummies

Naturally speaking toate posibilele nume alternative ale unei comenzi, dar le puteți adăuga la vocabular. De exemplu, perioada de la sfârșitul acestei fraze are mai multe pseudonime (nume alternative) decât majoritatea criminalilor. Cuvintele periodic, punct zecimal, punct, punct, oprire și oprire completă sunt toate nume valide pentru ...

Cum să creați gloanțe și liste numerotate în NaturallySpeaking - manechine

Cum să creați gloanțe și liste numerotate în NaturallySpeaking - manechine

Scrierea clară și concisă necesită mai mult decât simple paragrafe. De exemplu, pentru cărți Dummies nu puteam exista fără gloanțe și liste numerotate. Cum puteți crea liste cu marcatori cu comenzi vocale în NaturallySpeaking? În aplicațiile de limbă naturală și de control al textului complet, dictează textul pe care doriți să îl marcați lângă și apoi spuneți: "Format ...

Cum să Personalizați fereastra DragonPad - manechine

Cum să Personalizați fereastra DragonPad - manechine

ÎN cazul în care vă întrebați, meniu în DragonPad. Prin "aspect", aceasta înseamnă chestii asemănătoare cu barele de instrumente, înfășurarea textului în fereastră și unitățile de măsură pe riglă (metrice, engleze sau tipărire). Pentru a vizualiza toate barele de instrumente din DragonPad, faceți clic pe Vizualizare pentru a obține o listă cu ...

Alegerea editorilor

Administrare rețea fără fir: valuri și frecvențe - manechine

Administrare rețea fără fir: valuri și frecvențe - manechine

Atmosfera. Nu le puteți vedea sau auzi, dar receptoarele radio le pot prelua și le pot transforma în sunete, imagini sau - în cazul rețelelor fără fir - date. Undele radio sunt de fapt valuri ciclice de energie electronică care se repetă la ...

Administrarea rețelei fără fir: Wardrivers și Warchalkers - dummies

Administrarea rețelei fără fir: Wardrivers și Warchalkers - dummies

Termeni, inclusiv wardriving și warchalking. Dacã wardrivingul ºi warchalking-ul reprezintã de fapt ameninþãri de securitate este o problemã care este supusã unei mulþi dezbateri. Wardriving Wardriving se referă la practica de a conduce în jurul orașului cu calculatoare notebook care caută acces liber la rețele fără fir ...