Video: speller 2025
Prima decizie pe care trebuie să o faceți înainte de a analiza datele dvs. este reprezentarea acelor date în R. Dacă datele dvs. au doar o singură dimensiune, atunci știți deja că vectorii reprezintă acest tip de date foarte bine. Cu toate acestea, dacă datele dvs. au mai mult de o dimensiune, aveți posibilitatea de a alege utilizarea matricelor, a listelor sau a cadrelor de date. Deci, întrebarea este: Când folosiți ce?
Matricele și matricele cu dimensiuni mai mari sunt utile atunci când toate datele dvs. sunt de o singură clasă - cu alte cuvinte, toate datele sunt numerice sau toate datele sunt caractere. Dacă sunteți matematician sau statistician, sunteți familiarizat cu matricile și probabil că utilizați acest tip de obiect foarte frecvent.
Dar în multe situații practice, veți avea date care au mai multe clase diferite - cu alte cuvinte, veți avea un amestec de date numerice și de caractere. În acest caz, trebuie să utilizați fie liste, fie cadre de date.
Dacă vă imaginați datele ca o singură foaie de calcul, un cadru de date este, probabil, o alegere bună. Amintiți-vă că un cadru de date este pur și simplu o listă de vectori numiți de aceeași lungime, care este conceptual foarte asemănător cu o foaie de calcul cu coloane și o rubrică pentru fiecare coloană.
Dacă sunteți familiarizat cu bazele de date, vă puteți gândi la un cadru de date asemănător cu un singur tabel dintr-o bază de date. Cadrele de date sunt extrem de utile și, în multe cazuri, vor fi primele alegeri de obiecte pentru stocarea datelor.
Dacă datele dvs. constau dintr-o colecție de obiecte, dar nu o puteți reprezenta ca o matrice sau un cadru de date, atunci o listă este alegerea ideală. Deoarece listele pot conține tot felul de alte obiecte, inclusiv alte liste sau cadre de date, ele sunt extrem de flexibile. În consecință, R dispune de o mare varietate de instrumente pentru procesarea listelor.
Este posibil să găsiți că un cadru de date este o alegere foarte potrivită pentru majoritatea sarcinilor de analiză și prelucrare a datelor. Este un mod foarte convenabil de a reprezenta datele dvs. și este similar cu lucrul cu tabelele bazei de date. Când citiți date dintr-un fișier cu valoare separată prin virgulă (CSV) cu funcția citită. csv () sau citiți. table (), R pune rezultatele într-un cadru de date.
Obiect | Descriere | Comentarii |
---|---|---|
vector | Obiectul de date de bază din R, constând dintr-.
Gândiți-vă la aceasta ca o singură coloană sau rând într-o foaie de calcul sau o coloană |
într-o tabelă de baze de date.
matrice sau matrice |
Un obiect multidimensional de un singur tip (cunoscut ca | atomic
). O matrice este o matrice de două dimensiuni. Când trebuie să stocați numere în mai multe dimensiuni, utilizați matrice |
.
listă |
Listele pot conține obiecte de orice tip. | Listele sunt foarte utile pentru stocarea colecțiilor de date care | aparțin împreună. Deoarece listele pot conține liste, acest tip de obiect
este foarte util. date. cadru |
Cadrele de date reprezintă un tip special de listă denumită în care toate elementele | au aceeași lungime.
Cadrele de date sunt similare cu o singură foaie de calcul sau cu un tabel |
într-o bază de date.
![]() |