Video: Cum sa inveti simplu si rapid?! 2025
Când vorbim despre remodelarea datelor în R, este important să recunoaștem datele în formate lungi și largi. Aceste metafore vizuale descriu două moduri de a reprezenta aceleași informații. Este util să cunoașteți aceste formate atunci când utilizați R.
Puteți recunoaște datele în format larg prin faptul că coloanele reprezintă, în general, grupuri. Deci, exemplul nostru de jocuri de baschet este în format larg, deoarece există o coloană pentru coșurile făcute de fiecare dintre participanți:
Locul de desfășurare a jocului Granny Geraldine Gertrude 1 Bruges 12 5 11 2 2 Ghent 4 4 5 3 Ghent 5 2 6 4 4 Bruges 6 4 7
În schimb, format de exact aceleași date:
Valoarea variabilă a locației jocului 1 Bruges Bunică 12 2 2 Ghent Bunică 4 3 3 Ghent Bunică 5 4 4 Bruges Bunică 6 5 Prima Bruges Geraldine 5 6 2 Ghent Geraldine 4 7 3 Ghent Geraldine 2 8 4 Bruges Geraldine 4 9 Bruges Gertrude 11 10 2 Ghent Gertrude 5 11 3 Ghent Gertrude 6 12 4 Bruges Gertrude 7
Observați cum, în format lung, cele trei coloane pentru Granny, Geraldine și Gertrude au dispărut. În locul lor, aveți acum o coloană numită valoare care conține scorul real și o coloană numită variabilă care leagă scorul de una dintre cele trei doamne.
Variabilele de identificare:-
Identifier sau ID variabilele identifică observațiile. Gândiți-vă la acestea ca la cheia care vă identifică observațiile. (În proiectarea bazei de date, acestea se numesc chei primare sau secundare.) Variabile măsurate:
-
Aceasta reprezintă măsurătorile pe care le-ați observat.