Cum se încarcă datele într-un model de învățare supravegheat SVM - dummies

Video: Week 10 2024

Pentru analiza predictivă, trebuie să încărcați datele pentru algoritmi pentru utilizare. Încărcarea setului de date Iris în Scikit este la fel de simplă ca și emiterea a două linii de cod deoarece Scikit a creat deja o funcție pentru a încărca setul de date.

Sepal Lungime	Sepal Lățime	Lungime petală	Lățime petală	Clasă țintă / etichetă
5. 1	3. 5	1. 4	0. 2	Setosa (0)
7. 0	3. 2	4. 7	1. 4	Versicolor (1)
6. 3	3. 3	6. 0	2. 5	Virginica (2)

Deschideți o nouă sesiune a shell-ului interactiv Python.

Folosește o nouă sesiune Python, astfel încât nu mai rămîne nimic în memorie și ai o lucrare curată pentru a lucra cu.
Introduceți următorul cod în solicitare și observați ieșirea: >>>> de la sklearn. seturi de date import load_iris >>> iris = load_iris ()
```
După executarea acestor două instrucțiuni, nu ar trebui să vedeți niciun mesaj de la interpret. Variabila iris trebuie să conțină toate datele din iris. csv fișier.
```
Înainte de a crea un model predictiv, este important să înțelegeți puțin despre noua variabilă iris și ce puteți face cu ea. Acest lucru face ca codul să fie mai ușor de urmărit și procesul este mult mai simplu de înțeles. Puteți verifica valoarea irisului tastând-o în interpret. >>>> iris

Ieșirea va fi tot conținutul din iris. csv, împreună cu alte informații despre setul de date care au încărcat funcția load_iris în variabilă. Variabila este o structură de date a dicționarului cu patru proprietăți principale. Proprietățile importante ale irisului sunt enumerate mai jos.

Numele proprietății

Descriere

date	Conține toate măsurătorile observațiilor.
feature_name	Conține numele caracteristicii (numele atributului).
țintă	Conține toate țintele (etichetele) ale observațiilor.
numele țintă	Conține numele claselor.
Puteți tipări valorile în interpret, tastând numele variabilei urmat de punct urmat de numele proprietății. Un exemplu este folosirea irisului. datele pentru a accesa proprietatea irisului, după cum urmează: >>>> iris. date	Aceasta este o modalitate standard de a accesa proprietățile unui obiect în multe limbi de programare.

Pentru a crea o instanță a clasificatorului SVM, tastați următorul cod în interpret: >>>> din sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)

Prima linie de cod importa biblioteca SVC Linear in sesiune. Clasificatorul Vector de Suport liniar (SVC) este o implementare a SVM pentru clasificarea liniară și are suport multi-clasă.Setul de date este oarecum separabil liniar și are trei clase, deci ar fi o idee bună să experimentați cu SVC Linear pentru a vedea cum funcționează.

A doua linie creează instanța folosind variabila svmClassifier. Aceasta este o variabilă importantă de reținut. Parametrul random_state vă permite să reproduceți aceste exemple și să obțineți aceleași rezultate. Dacă nu ați introdus parametrul random_state, rezultatele dvs. pot diferi de cele afișate aici.