Video: Tutorial vectorizare ArcGIS - Partea I - Crearea și organizarea datelor vectoriale 2024
Explorarea datelor are cerințe foarte stricte pentru organizarea datelor. Nu sunt cerințe exotice, complexe sau dificile, dar sunt stricte. Figura arată un eșantion de date văzute ca un tabel în software-ul de exploatare a datelor.
Fiecare rând reprezintă o parcelă de bunuri imobiliare. Informațiile despre parcelele imobiliare sunt organizate în coloane. Prima coloană conține numărul de identificare fiscală (TAXKEY), a doua coloană conține valoarea evaluată a terenului dintr-o evaluare preliminară (P_A_LAND) și așa mai departe.
Fiecare intrare dintr-un singur rând se referă la o anumită parcelă de teren. Fiecare intrare în oricare coloană este același tip de informație. Niciun rând sau coloană nu este lăsat necompletat din motive legate de stil și lizibilitate. Aceste date sunt organizate corespunzător pentru investigarea diferențelor dintre parcelele imobiliare.
În cazul în care, în loc de imobiliare, investigați oamenii, fiecare persoană ar fi reprezentată de un rând în date și toate detaliile despre oameni vor fi organizate în coloane. Dacă investigați radiografiile toracice, fiecare radiografie toracică ar fi reprezentată printr-un rând din date și toate detaliile despre radiografia toracică vor fi organizate în coloane.
În terminologia analizei datelor, lucrurile pe care le studiați - lucrurile din rânduri - sunt numite înregistrări cazuri sau . Și detaliile despre ele, care sunt în coloane, sunt numite variabile . Veți auzi și coloanele numite , în special în contextul bazelor de date.
Deci, extragerea de date necesită date organizate cu un singur rând pentru fiecare caz și o singură coloană pentru fiecare variabilă. Multe surse de date sunt deja organizate în acest fel. Statisticienii organizează date în acest mod prin obișnuință. Este posibil ca profesioniștii din baze de date să nu folosească această abordare pentru o mare parte din munca lor, dar ei vor înțelege, de obicei, ceea ce doriți dacă îl numiți o masă plată .
Veți găsi variații subtile în structura datelor. Unele tipuri de software utilizează informații descriptive într-un antet înainte de date, cum ar fi anumite formate de specialitate asociate cu aplicațiile Orange și Weka pentru extragerea de date. Unele proceduri analitice complexe au cerințe suplimentare sau ușor variate (acestea sunt destul de neobișnuite). Dar nucleul datelor are în continuare cazurile în rânduri și variabile în coloane.