Cuprins:
Video: Măsurarea tensiunii arteriale 2025
Puteți compara cu ușurință exemple din datele dvs. folosind calcule, dacă vă gândiți la fiecare dintre acestea ca vector. Următoarele informații descriu modul de măsurare a asemănării dintre vectori pentru a efectua sarcini, cum ar fi calculul distanței dintre vectori în scopuri de învățare.
Înțelegerea asemănării
Într-o formă vectorică, puteți vedea fiecare variabilă din exemple ca o serie de coordonate, fiecare indicând o poziție într-o altă dimensiune spațială. Dacă un vector are două elemente, adică are doar două variabile, lucrul cu acesta este la fel ca verificarea poziției unui element pe o hartă utilizând primul număr pentru poziția de pe axa Est-Vest, iar cel de-al doilea pe cel nord- Axa de sud.
De exemplu, numerele dintre paranteze (1, 2) (3, 2) și (3, 3) sunt toate exemple de puncte. Fiecare exemplu este o listă ordonată de valori (numită tuplă) care poate fi ușor localizată și tipărită pe o hartă folosind prima valoare a listei pentru x (axa orizontală) și a doua pentru y (axa verticală). Rezultatul este un scatterplot.
Dacă setul de date, în formă de matrice, are numeroase caracteristici numerice (coloanele), în mod ideal numărul de caracteristici reprezintă dimensiunile spațiului de date, în timp ce rândurile (exemplele) punct, care din punct de vedere matematic este un vector. Atunci când vectorul dvs. are mai mult de două elemente, vizualizarea devine problematică deoarece reprezentarea dimensiunilor deasupra celui de-al treilea nu este ușoară (la urma urmei, trăim într-o lume tridimensională).
Cu toate acestea, vă puteți strădui să transmități mai multe dimensiuni de către un anumit scop, cum ar fi prin utilizarea dimensiunii, formei sau culorii pentru alte dimensiuni. În mod evident, aceasta nu este o sarcină ușoară și, adesea, rezultatul este departe de a fi intuitiv. Cu toate acestea, puteți înțelege ideea în care punctele ar fi în spațiul dvs. de date prin imprimarea sistematică a multor grafice în timp ce se iau în considerare dimensiunile două câte două. Astfel de parcele sunt numite matrice de scatterplots.
Nu vă faceți griji cu privire la multidimensionalitate. Extindeți normele pe care le-ați învățat în două sau trei dimensiuni la mai multe dimensiuni, deci dacă o regulă funcționează într-un spațiu bidimensional, funcționează și într-unul multiplu. Prin urmare, toate exemplele se referă mai întâi la exemple bidimensionale.
Distanțele de calcul pentru învățare
Un algoritm poate învăța utilizând vectori ai numerelor care utilizează măsurători de distanță. Adesea, spațiul implicat de vectorii dvs. este un spațiu metric care este un spațiu ale cărui distanțe respectă anumite condiții specifice:
- Nu există distanțe negative și distanța dvs. este zero numai atunci când punctul de plecare și punctul de încheiere coincid (numit nonnegativity).
- Distanța este aceeași mergând de la un punct la altul și invers (numită simetrie).
- Distanța dintre un punct inițial și unul final este întotdeauna mai mare sau, la fel de rău, distanța care trece de la punctul inițial la cel de-al treilea și de acolo până la cel final (numit inegalitatea triunghiului < - ceea ce înseamnă că nu există comenzi rapide). Distanțele care măsoară un spațiu metric sunt distanța euclidiană, distanța Manhattan și distanța Chebyshev. Acestea sunt toate distantele care se pot aplica vectorilor numerici.
Distanța eucidiană
Cea mai obișnuită este distanța euclidiană, descrisă și ca norma l2 a doi vectori (citiți această discuție a lui l1, 12 și normele linfinității). Într-un plan bidimensional, distanța euclidiană se refacă ca linia dreaptă care leagă două puncte și o calculați ca rădăcină pătrată a sumei diferenței pătrat între elementele a două vectori. În planul anterior, distanța euclidiană dintre punctele (1, 2) și (3, 3) poate fi calculată în R ca sqrt ((1-3) ^ 2 + (2-3) ^ 2) distanța de aproximativ 2. 236.
Distanța Manhattan
O altă măsură utilă este distanța Manhattan (descrisă și ca norma l1 a doi vectori). Calculați distanța Manhattan prin însumarea valorii absolute a diferenței dintre elementele vectorilor. Dacă distanța euclidiană marchează cel mai scurt traseu, distanța Manhattan marchează cea mai lungă ruta, asemănătoare direcțiilor unui taxi care se deplasează într-un oraș. (Distanța este, de asemenea, cunoscută sub numele de taxi sau distanță de oraș). De exemplu, distanța dintre punctele (1, 2) și (3, 3) din Manhattan este abs (1-3)), care are ca rezultat 3.
Distanța Chebyshev
Distanța Chebyshev sau valoarea maximă ia valoarea maximă a diferenței absolute dintre elementele vectorilor. Este o măsură de distanță care poate reprezenta modul în care un rege se mișcă în jocul de șah sau, în logistica depozitului, operațiunile necesare unei macarale suspendate pentru a muta o navetă de la un loc la altul.
În procesul de învățare a mașinilor, distanța Chebyshev se poate dovedi utilă atunci când aveți multe dimensiuni de luat în considerare și majoritatea sunt doar irelevante sau redundante (în Chebyshev, alegeți doar cea a cărei diferență absolută este cea mai mare). În exemplul folosit mai sus, distanța este pur și simplu 2, valoarea maximă între (1-3) și abs (2-3).
