Video: Week 10 2024
Pentru analiza predictivă, trebuie să încărcați datele pentru algoritmi pentru utilizare. Încărcarea setului de date Iris în Scikit este la fel de simplă ca și emiterea a două linii de cod deoarece Scikit a creat deja o funcție pentru a încărca setul de date.
Sepal Lungime | Sepal Lățime | Lungime petală | Lățime petală | Clasă țintă / etichetă |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versicolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Deschideți o nouă sesiune a shell-ului interactiv Python.
Folosește o nouă sesiune Python, astfel încât nu mai rămîne nimic în memorie și ai o lucrare curată pentru a lucra cu.
-
Introduceți următorul cod în solicitare și observați ieșirea: >>>> de la sklearn. seturi de date import load_iris >>> iris = load_iris ()
După executarea acestor două instrucțiuni, nu ar trebui să vedeți niciun mesaj de la interpret. Variabila iris trebuie să conțină toate datele din iris. csv fișier.
Ieșirea va fi tot conținutul din iris. csv, împreună cu alte informații despre setul de date care au încărcat funcția load_iris în variabilă. Variabila este o structură de date a dicționarului cu patru proprietăți principale. Proprietățile importante ale irisului sunt enumerate mai jos.
Numele proprietății
Descrieredate | Conține toate măsurătorile observațiilor. |
---|---|
feature_name | Conține numele caracteristicii (numele atributului). |
țintă | Conține toate țintele (etichetele) ale observațiilor. |
numele țintă | Conține numele claselor. |
Puteți tipări valorile în interpret, tastând numele variabilei urmat de punct urmat de numele proprietății. Un exemplu este folosirea irisului. datele pentru a accesa proprietatea irisului, după cum urmează: >>>> iris. date | Aceasta este o modalitate standard de a accesa proprietățile unui obiect în multe limbi de programare. |
Pentru a crea o instanță a clasificatorului SVM, tastați următorul cod în interpret: >>>> din sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
Prima linie de cod importa biblioteca SVC Linear in sesiune. Clasificatorul Vector de Suport liniar (SVC) este o implementare a SVM pentru clasificarea liniară și are suport multi-clasă.Setul de date este oarecum separabil liniar și are trei clase, deci ar fi o idee bună să experimentați cu SVC Linear pentru a vedea cum funcționează.
A doua linie creează instanța folosind variabila svmClassifier. Aceasta este o variabilă importantă de reținut. Parametrul random_state vă permite să reproduceți aceste exemple și să obțineți aceleași rezultate. Dacă nu ați introdus parametrul random_state, rezultatele dvs. pot diferi de cele afișate aici.