Cuprins:
- Cantitățile cele mai utilizate sunt de fapt cuantificările 0 la sută și 100 la sută. Puteți să le numiți la fel de ușor și minim, pentru că așa sunt. Puteți obține împreună funcțiile min () și max () împreună cu funcția range (). Această funcție vă oferă în mod convenabil intervalul de date. Deci, pentru a afla între cele două valori ale tuturor kilometrajelor, faceți pur și simplu următoarele:
- caractelat
- Toate aceste funcții au un argument na. rm care vă permite să eliminați toate valorile NA înainte de a calcula statistica respectivă. Dacă nu faceți acest lucru, orice vector care conține NA va avea NA ca rezultat. Acest lucru funcționează identic cu na. argumentul rm al funcției sum ().
Video: Peter Tyack: The intriguing sound of marine mammals 2025
Un singur număr nu vă spune multe despre datele dvs. Adesea este la fel de important să cunoaștem răspândirea datelor. Puteți utiliza R pentru a examina această răspândire utilizând o serie de abordări diferite.
În primul rând, puteți calcula varianța sau devierea standard pentru a rezuma dispersia într-un singur număr. Pentru aceasta, aveți funcțiile convenabile var () pentru variația și sd () pentru abaterea standard. De exemplu, calculați deviația standard a variabilei mpg în mașinile de cadre de date, astfel:
Pe lângă mijloc și variație, puteți, de asemenea, să aruncați o privire la cuanticele. Un
quantile, sau percentil, vă spune cât de mult din datele dvs. se află sub o anumită valoare. Cantitatea de 50%, de exemplu, nu este decât mediana. Din nou, R are câteva funcții convenabile pentru a vă ajuta să vă uitați la cuanticele. Cum se calculează intervalul de date în R
Cantitățile cele mai utilizate sunt de fapt cuantificările 0 la sută și 100 la sută. Puteți să le numiți la fel de ușor și minim, pentru că așa sunt. Puteți obține împreună funcțiile min () și max () împreună cu funcția range (). Această funcție vă oferă în mod convenabil intervalul de date. Deci, pentru a afla între cele două valori ale tuturor kilometrajelor, faceți pur și simplu următoarele:
> gama (mașini $ mpg) [1] 10. 4 33. 9
Cum se calculează datele despre caracterele de date în RDomeniul vă oferă doar informații limitate. Adesea, statisticienii raportează primul și al treilea
caractelat
de lângă interval și median. Aceste quartile sunt, respectiv, cuantificările de 25 la sută și 75 la sută, care sunt numerele pentru care un sfert și trei sferturi din date sunt mai mici. Obțineți aceste numere folosind funcția quantile (), astfel:
Funcția quantile () vă poate oferi orice cantitate doriți. Pentru asta, folosiți argumentul probs. Dați probabil probele (sau probabilitățile) ca număr fracționat. Pentru cuantilele de 20%, de exemplu, utilizați valoarea 0. 20 ca argument pentru valoare.Acest argument are de asemenea un vector ca valoare, astfel încât să puteți obține, de exemplu, cuantificările de 5% și 95% astfel: >> quantile (mașini $ mpg, probs = c (0.05, 0. 95)) 5% 95% 11. 995 31. 300
Valoarea implicită pentru argumentul probs este un vector reprezentând minimul (0), primul quartil (0,25), mediana (0,5) quartile (0,75) și maxim (1).
Toate aceste funcții au un argument na. rm care vă permite să eliminați toate valorile NA înainte de a calcula statistica respectivă. Dacă nu faceți acest lucru, orice vector care conține NA va avea NA ca rezultat. Acest lucru funcționează identic cu na. argumentul rm al funcției sum ().
