Video: Chhaavan: Ranjit Bawa | Full Audio | Ik Tare Wala | Jassi X | Dharamvir Thandi 2024
Disciplina de învățare a mașinilor are un catalog bogat și extins de tehnici. Mahout aduce o serie de instrumente statistice și algoritmi la masă, dar captează doar o fracțiune din acele tehnici și algoritmi, deoarece sarcina de a transforma aceste modele într-un cadru MapReduce este o provocare.
În timp, Mahout este sigur că va continua să-și extindă setul de instrumente statistice, dar până atunci toți oamenii de știință și statisticienii trebuie să fie conștienți de software-ul alternativ de modelare statistică - unde vine R.
Limba R este un puternic și popular limbaj statistic și mediu de dezvoltare deschisă. Oferă un ecosistem bogat de analiză care poate ajuta oamenii de știință cu date de explorare, vizualizare, analiză statistică și computere, modelare, învățare automată și simulare. Limbajul R este utilizat în mod obișnuit de către statisticieni, mineri de date, analiști de date și (în zilele noastre) oameni de știință.
Comprehensive R Archive Archive (CRAN) care, din momentul redactării, conțin peste 3000 de pachete de analiză statistică. Aceste extensii pot fi trase în orice proiect R, oferind instrumente analitice bogate pentru clasificarea, regresia, gruparea, modelarea liniară și algoritmi de învățare mai specializați. Limba este accesibilă celor familiarizați cu tipurile simple de structuri de date - vectori, scalare, cadre de date (matrice) și altele asemenea - utilizate în mod obișnuit de statisticieni și de programatori.
Aceste sisteme nu pot fi distribuite și nu au fost dezvoltate pentru a fi scalabile pentru lumea modernă de petabyte de date mari. Propunerile de depășire a acestor limitări trebuie să extindă domeniul de aplicare al R, dincolo de mediile de încărcare în memorie și singurele medii de execuție a calculatorului, menținând în același timp flerul lui R pentru algoritmii statistici ușor de implementat.