Acasă Finanțe personale Elementele de bază ale tipurilor și structurilor de date în programarea R pentru analiza predictivă - dummy

Elementele de bază ale tipurilor și structurilor de date în programarea R pentru analiza predictivă - dummy

Cuprins:

Video: Data Analysis in R by Dustin Tran 2024

Video: Data Analysis in R by Dustin Tran 2024
Anonim

În programarea R pentru analiza predictivă, datele tipuri sunt uneori confundate cu structurile de date . Fiecare variabilă din memoria programului are un tip de date. Sigur, puteți să scăpați de mai multe variabile în programul dvs. și să fiți în continuare gestionați. Dar probabil că nu va funcționa atât de bine dacă aveți sute (sau mii) de variabile; trebuie să dați fiecărei variabile un nume, astfel încât să puteți accesa aceasta.

Este mai eficient să stocați toate aceste variabile într-o colecție logică.

Tipuri de date

Ca și alte limbi de programare integrate, R oferă multe tipuri de date și structuri de date. Nu este nevoie să specificați tipul pe care îl alocați unei variabile; interpretul va face asta pentru tine. Cu toate acestea, puteți specifica sau converti tipul dacă este necesar; acest lucru se numește casting . Există trei tipuri de date:

  • Numeric: Acestea sunt numerele zecimale tipice. Acestea se numesc plutitoare (scurte pentru numere cu virgulă mobilă ) sau dublează în alte limbi.

  • Caractere: Acestea sunt șirurile dvs. formate cu combinații de litere, caractere și numere. Ele nu sunt menite să aibă nici un sens numeric. Acestea sunt numite șiruri de caractere în alte limbi.

  • Logică: TRUE sau FALSE. Utilizați întotdeauna aceste valori în R. Aceste valori sunt numite Booleani în alte limbi.

Comparând un șir de numere cu un număr numeric, interpretul convertește șirul de numere într-un număr numeric și apoi face o comparație numerică.

Exemple de tipuri de date sunt următoarele: >> ijkm <- i == j # logical> n <- i == k # logic

După executarea acelor rânduri de cod, valori și tipuri prin utilizarea funcției str (). Această operație arată astfel: >> str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> expresia în n alocarea este un exemplu de interpret care convertește temporar tipul de date k într-un număr numeric pentru a face evaluarea între numeric i și caracterul k.

Structurile de date

R vor avea nevoie de un loc pentru a stoca grupuri de tipuri de date pentru a lucra eficient cu acestea. Acestea sunt numite

structuri de date

.

Un exemplu real al acestui concept este un garaj de parcare: este o structură care stochează eficient automobilele. Este proiectat pentru a parca cât mai multe automobile posibil și permite autovehiculelor să intre și să părăsească eficient structura.De asemenea, nici un alt obiect, în afară de automobile, nu ar trebui să fie parcat într-o structură de parcare. Structurile de date includ: Vectori:

Vectoarele stochează un set de valori dintr-un singur tip de date. Gândește-te la asta ca la un depozit săptămânal. Fiecare compartiment din cutie poate stoca doar un anumit tip de obiect. După ce ați pus niște pastile într-unul din compartimente, toate celelalte compartimente trebuie de asemenea să fie umplut fie cu pastile zero, fie cu mai multe pastile.

Nu poți pune monede în aceeași cutie; trebuie să utilizați o altă "casetă de pilule" (vector) pentru asta. De asemenea, odată ce stocați un număr într-un vector, toate valorile viitoare ar trebui să fie și numere. În caz contrar, interpretul convertește toate numerele în caractere.

  • Matrice: Matricea

  • arata ca o foaie de calcul Excel: In esenta este un tabel format din randuri si coloane. Datele varsă celulele goale după ordinea rândului sau coloanei, în care specificați când creați matricea. Toate coloanele trebuie să aibă același tip de date. Rame de date: Un cadru de date este similar cu o matrice, cu excepția coloanelor cadrului de date care poate conține diferite tipuri de date. Seturile de date utilizate în modelarea predictivă sunt încărcate în cadre de date și stocate acolo pentru utilizare în model.

    Factori:

  • Un factor

  • este ca un vector cu un număr limitat de valori distincte. Numărul de valori distincte este denumit nivel . Puteți utiliza factori pentru a trata o coloană care are un număr limitat și cunoscut de valori ca valori categorice. În mod prestabilit, datele de caractere sunt încărcate în cadrele de date ca factori. Accesați vectori, matrici și cadre de date utilizând notarea de array . De exemplu, ați tasta

v [5] pentru a accesa al cincilea element al vectorului v. Pentru o matrice și un cadru de date bidimensional, introduceți numărul rândului și numărul coloanei, separate prin virgulă, în parantezele pătrate. De exemplu, tastați m [2, 3] pentru a accesa al doilea rând, valoarea a treia pentru matricea m . Structurile de date sunt un subiect avansat în domeniul informaticii. Deocamdată, rămânem la practic. Amintiți-vă că structurile de date au fost construite pentru a stoca anumite tipuri de date și au funcții pentru introducerea, ștergerea și recuperarea datelor.

Elementele de bază ale tipurilor și structurilor de date în programarea R pentru analiza predictivă - dummy

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...