Folosind programul Ecosystem Python for Data Science - dummies

Video: The Internet of Things by James Whittaker of Microsoft 2024

Trebuie să încărcați biblioteci pentru a efectua activități de știință în Python. Iată o prezentare generală a bibliotecilor pe care le puteți utiliza pentru știința datelor. Aceste biblioteci pot efectua mai multe funcții pentru omul de știință.

Accesarea instrumentelor științifice utilizând SciPy

Stiva SciPy conține o serie de alte biblioteci pe care le puteți descărca separat. Aceste biblioteci oferă suport pentru matematică, știință și inginerie. Când obțineți SciPy, primiți un set de biblioteci proiectate să lucreze împreună pentru a crea aplicații de diferite tipuri. Aceste biblioteci sunt

NumPy

SciPy

matplotlib

IPython

Sympy

pandas

. SciPy este o bibliotecă generală care oferă funcționalitate pentru mai multe domenii de probleme. De asemenea, oferă suport pentru bibliotecile specifice domeniului, cum ar fi Scikit-learn, Scikit-image și statsmodels.

Efectuarea calculului științific fundamental utilizând NumPy

Biblioteca NumPy furnizează mijloacele pentru efectuarea manipulării matricei n-dimensionale, care este critică pentru lucrul cu știința datelor. Nu ați putut accesa cu ușurință matrice n-dimensionale fără funcții NumPy care includ suport pentru algebră liniară, transformare Fourier și generare de numere aleatoare.

Analiza datelor folosind panda

Biblioteca pandas oferă suport pentru structurile de date și instrumentele de analiză a datelor. Biblioteca este optimizată pentru a îndeplini sarcinile de date științifice în special rapid și eficient. Principiul de bază din spatele pandelor este să furnizeze suport pentru analiza și modelarea datelor pentru Python, care este similar cu alte limbi, cum ar fi R.

Implementarea mașinilor de învățare folosind Scikit-learn

Biblioteca Scikit-learn este una dintre numeroasele Bibliotecile Scikit care se bazează pe capabilitățile oferite de NumPy și SciPy pentru a permite dezvoltatorilor Python să îndeplinească sarcini specifice domeniului. În acest caz, biblioteca se concentrează pe extragerea de date și analiza datelor. Acesta oferă acces la următoarele tipuri de funcționalități:

Clasificare
Regresie
Clustering
Reducerea dimensiunii
Selectarea modelului
Preprocesare

Plotarea datelor folosind matplotlib

Biblioteca matplotlib vă oferă o interfață de tip MATLAB pentru a crea prezentări de date ale analizei pe care o efectuați. În prezent, biblioteca este limitată la ieșirea 2D, dar vă oferă încă mijloacele necesare pentru a exprima grafic modelele de date pe care le vedeți în datele pe care le analizați.Fără această bibliotecă, nu ați putut crea o ieșire pe care oamenii din afara comunității științifice a datelor ar putea să o înțeleagă cu ușurință.

Parsarea documentelor HTML folosind Beautiful Soup

Descărcarea bibliotecii Beautiful Soup se găsește de fapt pe site-ul Python. Această bibliotecă oferă mijloacele de analiză a datelor HTML sau XML într-o manieră pe care Python o înțelege. Acesta vă permite să lucrați cu date bazate pe arbori.

În afară de furnizarea unui mijloc de lucru cu datele bazate pe arbori, Beautiful Soup ia multe lucruri din lucrul cu documentele HTML. De exemplu, acesta convertește automat codarea (maniera în care caracterele sunt stocate într-un document) de documente HTML de la UTF-8 la Unicode. Un dezvoltator Python ar trebui în mod normal să vă faceți griji cu privire la lucruri precum codarea, dar cu Supă frumoasă, vă puteți concentra în schimb pe codul dvs.