Video: Calculus III: Three Dimensional Coordinate Systems (Level 4 of 10) | Midpoint, Distance Formulas 2024
Primul pas spre modelarea predictivă este legarea variabilelor între ele. Un instrument simplu, remarcabil pentru asta este scatterplot. Este folosit pentru a relaționa o măsură continuă cu alta. Minerii de date uneori întind regulile și o folosesc și cu variabile categorice.
Axa orizontală ( x ) a graficului reprezintă valori ale unei variabile; axa verticală ( y ) reprezintă oa doua variabilă. Este posibil să nu aveți un sentiment care variabilă este independentă și care depinde de fiecare pereche de variabile.
Dacă faceți acest lucru, variabila independentă trebuie să fie pe axa orizontală. Fiecare punct de pe grafic reprezintă coordonatele, perechea de valori pentru cele două variabile într-un singur caz. (Aceste perechi sunt uneori numite xy perechi ).
Găsiți instrumentul scatterplot și configurați un instrument scatterplot de bază selectând două variabile de utilizat. Figura următoare prezintă acest instrument din meniul Orange; locația pentru instrument variază în funcție de produs.
Exemplul din imaginea următoare arată un afișaj interactiv; scatterplot apare imediat. Într-un alt instrument, este posibil să aveți nevoie de pași suplimentari pentru a executa și a crea graficul.
Exemplul scatterplot se referă la kilometrajul auto la puterea motorului. Puterea redusă este asociată cu un kilometraj ridicat, iar cu cât este mai mare de putere, cu atât kilometrajul este mai mic. Puteți vedea cu ușurință acest model în date. S-ar putea să observați o formă, nu liniară, ci oarecum curbată. Acest lucru ar putea oferi sugestii despre ce tipuri de modele să încercați mai târziu.
Aplicațiile de extragere a datelor au adesea unele caracteristici interactive în afișajele grafice. De exemplu, următoarea figură arată că mișcarea mouse-ului peste un punct arată valorile exacte ale celor două variabile pentru acel punct. Acest lucru este mai ușor decât încercarea de a citi valorile din axe!