Acasă Finanțe personale Modul de rulare a datelor de antrenament într-un model de învățare supravegheat SVM

Modul de rulare a datelor de antrenament într-un model de învățare supravegheat SVM

Video: Calling All Cars: Desperate Choices / Perfumed Cigarette Lighter / Man Overboard 2025

Video: Calling All Cars: Desperate Choices / Perfumed Cigarette Lighter / Man Overboard 2025
Anonim

Înainte de a putea alimenta clasificatorul SVM cu datele încărcate pentru analiza predictivă, trebuie să împărțiți întregul set de date într-un set de antrenament și set de test.

Din fericire, scikit-learn a implementat o funcție care vă va ajuta să împărțiți cu ușurință întregul set de date. Funcția train_test_split ia ca intrări un singur set de date și o valoare procentuală. Valoarea procentuală este utilizată pentru a determina dimensiunea setului de testare. Funcția returnează două seturi de date: setul de date de testare (cu dimensiunea specificată) și setul de date de antrenament (care utilizează datele rămase).

În mod obișnuit, se poate lua aproximativ 70-80% din date pentru a fi utilizate ca un set de antrenament și pentru a utiliza datele rămase ca set de testare. Dar setul de date Iris este foarte mic (doar 150 de cazuri), astfel încât să puteți lua 90% din acesta pentru a instrui modelul și a utiliza celelalte 10% ca date de testare pentru a vedea cum va funcționa modelul dvs. predictiv.

Introduceți codul următor pentru a vă împărți setul de date: >>>> de la sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (date iris, iris target, test_size = 0.10, random_state = 111)

Prima linie importă biblioteca de validare încrucișată în sesiunea dvs. A doua linie creează testul de la 10 la sută din eșantion.

x_train va conține 135 de observații și trăsăturile sale.

y_train va conține 135 de etichete în aceeași ordine ca 135 de observații.

x_test va conține 15 (sau 10%) observații și caracteristicile sale.

y_test va conține 15 etichete în aceeași ordine ca cele 15 observații.

Următorul cod verifică faptul că împărțirea este ceea ce vă așteptați:

>>>> X_train. forma (135, 4) >>> y_train. forma (135,) >>> X_test. forma (15, 4) >>> y_test. forma (15,)

Puteți observa din ieșire că există 135 de observații cu 4 caracteristici și 135 etichete în setul de antrenament. Setul de testare are 15 observații cu 4 caracteristici și 15 etichete.
Mulți începători din domeniul analizei predictive uită să împartă seturile de date - ceea ce introduce un defect serios în proiect. Dacă cele 150 de instanțe au fost încărcate în mașină ca date de antrenament, nu s-ar lăsa date neobișnuite pentru testarea modelului. Apoi, va trebui să recurgeți la reutilizarea unor instanțe de formare pentru a testa modelul predictiv.

Veți vedea că într-o astfel de situație, modelul întotdeauna prezice clasa corectă - pentru că utilizați aceleași date exacte pe care le-ați folosit pentru a instrui modelul.Modelul a văzut deja acest model înainte; nu va avea nici o problemă doar repetând ceea ce se vede. Un model predictiv de lucru trebuie să facă predicții pentru datele pe care nu le-a văzut încă.

Când aveți o instanță a unui clasificator SVM, un set de date de antrenament și un set de date de testare, sunteți pregătit să instruiți modelul cu datele de antrenament. Tastarea următorului cod în interpret va face exact acel: >>>> svmClassifier. fit (X_train, y_train)

Această linie de coduri creează un model de lucru pentru a face previziuni. În mod specific, un model predictiv care va prezice la ce clasă de Iris aparține un set de date fără marcă neetichetă. Exemplul svmClassifier va avea mai multe metode pe care le puteți apela pentru a face diverse lucruri.

De exemplu, după apelarea metodei de potrivire, metoda cea mai utilă de apel este metoda de predicție. Aceasta este metoda la care veți alimenta date noi; în schimb, ea prezice rezultatul.

Modul de rulare a datelor de antrenament într-un model de învățare supravegheat SVM

Alegerea editorilor

Lucruri de luat în considerare înainte de a vă trage filmul DSLR - dummies

Lucruri de luat în considerare înainte de a vă trage filmul DSLR - dummies

Ca producător de filme, la aspectele creative care intră în utilizarea tehnologiei DSLR pentru a vă trage filmul. Cu toate acestea, veți face cea mai bună utilizare a timpului dvs. dacă luați în considerare aceste lucruri în procesul de planificare. Trageți pentru a edita Cu toții am auzit axiomul că sunt făcute filme grozave în ...

Sfaturi pentru direcționarea filmului digital - manechine

Sfaturi pentru direcționarea filmului digital - manechine

Ca regizor, este treaba voastră să aduceți filmul la viață modul în care actorii dvs. joacă personajele și modul în care fiecare echipă a împușcat filmul. Regizorul colaborează cu actorii și echipajul pentru a obține cele mai bune rezultate de la ei și pentru a vă asigura că povestea se spune prin ceea ce fac. Direcționați-vă ...

Zece nunta Tehnici DSLR Filmmaking - mulaje

Zece nunta Tehnici DSLR Filmmaking - mulaje

Folosind DSLR-ul pentru a filma o nunta, de obicei, se află pe capătul opus al reclamei spectru de la realizarea filmului dvs. auteur. Iată primele zece aspecte pe care trebuie să le luați în considerare pentru a le menține viața atunci când captați acest eveniment o dată în viață. Au echipamentul video corect Tu nu va fi capabil să facă o nuntă, până ...

Alegerea editorilor

Cum să dezactivați fasciculul de asistență pentru autofocus pe un Canon 60D - dummies

Cum să dezactivați fasciculul de asistență pentru autofocus pe un Canon 60D - dummies

Camera foto emite un fascicul de focalizare AF (autofocus) de la blițul încorporat atunci când apăsați pe jumătate butonul declanșator (presupunând că blițul este deschis, desigur). Acest puls de lumină ajută camera să vă "vadă" mai bine țintă, îmbunătățind performanța sistemului de focalizare automată. Dacă fotografiați într-o situație în care ...

Cum să ștergeți imagini de la Canon EOS 7D Mark II - manechine

Cum să ștergeți imagini de la Canon EOS 7D Mark II - manechine

Imagine, decideți dacă este un păstor. Dacă în timp ce revizuiți o imagine pe Canon EOS 7D Mark II, nu vă place imaginea din nici un motiv, o puteți șterge. Cu toate acestea, ștergerea imaginilor trebuie făcută cu precauție extremă, deoarece sarcina nu poate fi anulată. După ce ștergeți un ...

Cum să editați filme pe un Canon EOS 60D - dummies

Cum să editați filme pe un Canon EOS 60D - dummies

Caracteristica 60D Editare face delicios ușor pentru a elimina părțile nedorite de la începutul sau sfârșitul unui film chiar pe aparatul foto. Această editare la bord este la îndemână, dar de bază, deci nu vă așteptați la minuni. Iată pașii simpli pentru a tăia începutul sau sfârșitul unui film: faceți clic pe pictograma Editare (arată ...

Alegerea editorilor

Controlul nașterii: cum funcționează prezervativul feminin - manechine

Controlul nașterii: cum funcționează prezervativul feminin - manechine

Ca opțiune de sex sigur, prezervativul feminin mai puțin cunoscut și mai scump decât prezervativul masculin obișnuit. Atât prezervativul cât și prezervativul sunt la fel: este o teacă care trebuie purtată în timpul actului sexual, pentru a preveni sarcina neintenționată și pentru a diminua riscul bolilor cu transmitere sexuală ...

Verificarea glandelor prostate - manechine

Verificarea glandelor prostate - manechine

Care au examene de prostată obișnuite sunt importante ca bărbați. Glanda prostatică - situată sub vezică - se poate mări și poate provoca urinare frecventă. Această problemă, numită hipertrofie prostatică benignă, este deranjantă, dar nu periculoasă. Cancerul de prostată, pe de altă parte, poate fi destul de periculos dacă nu este descoperit și tratat în ...

O privire de ansamblu asupra bolilor transmise sexual sau a persoanelor cu transmitere sexuală - manechine

O privire de ansamblu asupra bolilor transmise sexual sau a persoanelor cu transmitere sexuală - manechine

, Sau boli cu transmitere sexuală, aceste boli nu reprezintă o amenințare inactivă pentru a ține sub control activitatea sexuală nepăsătoare. DTS (cunoscute și sub numele de infecții cu transmitere sexuală sau infecții cu transmitere sexuală) reprezintă o amenințare incredibil de tangibilă, afectând 25% dintre americani cu vârste între 15 și 55 de ani. Deoarece invazia sexuală cuprinde ...