Acasă Finanțe personale Cum se utilizează Smoothing Data în Analytics Predictive - Dummy

Cum se utilizează Smoothing Data în Analytics Predictive - Dummy

Cuprins:

Video: ETN - Electroneum - Webdollar - Phone Jacking -Mining Emission Curves - ETN242 Closed - PRICE 2024

Video: ETN - Electroneum - Webdollar - Phone Jacking -Mining Emission Curves - ETN242 Closed - PRICE 2024
Anonim

Netezirea datelor în analiza predictivă încearcă în esență să găsească "semnalul" în "zgomot" aruncarea punctelor de date care sunt considerate "zgomotoase". Ideea este de a accentua modelele din date și de a evidenția tendințele la care se îndreaptă datele.

Implicația care stă la baza netezirii datelor este aceea că datele constau în două părți: o parte (care constă din punctele de bază ) care semnifică tendințe generale sau tendințe reale și o altă parte care constă în majoritatea abaterilor zgomot ) - unele puncte fluctuante care rezultă din o anumită volatilitate a datelor. Netezirea datelor încearcă să elimine partea a doua.

Cum să scadă zgomotul

Netezirea datelor funcționează pe mai multe ipoteze:

  • Această fluctuație a datelor este mai probabil să fie zgomot.

  • Că partea zgomotoasă a datelor este de scurtă durată.

  • Că fluctuația datelor, indiferent de cât de variată ar putea fi, nu va afecta tendințele care stau la baza reprezentate de punctele de bază.

Zgomotul în date tinde să fie întâmplător; fluctuațiile sale nu ar trebui să afecteze tendințele generale obținute din examinarea celorlalte date. Astfel, reducerea sau eliminarea punctelor de zgomot poate clarifica tendințele și modelele reale ale datelor - în realitate, îmbunătățind raportul semnal-zgomot al datelor. „

Dacă ați identificat corect zgomotul și apoi l-ați redus, netezirea datelor vă poate ajuta să anticipați următorul punct de date observat pur și simplu urmând tendințele majore pe care le-ați detectat în cadrul datelor.

Netezirea datelor se referă la majoritatea punctelor de date, pozițiile lor într-un grafic și la ceea ce modelele rezultate prezic despre tendința generală a prețului (de exemplu) al unui preț, indiferent dacă direcția sa generală este în sus, în jos sau în lateral.

O prognoză bazată pe o tendință generală dedusă din datele netezite presupune că orice direcție pe care au urmat datele până acum va continua în viitor într-un mod compatibil cu tendința. Pe piața de valori, de exemplu, performanța trecută nu este o indicație clară a performanțelor viitoare, dar cu siguranță poate fi un ghid general pentru mișcarea viitoare a prețului acțiunilor.

Metode, avantaje și dezavantaje ale netezirii datelor

Netezirea datelor nu trebuie confundată cu

montarea unui model, care face parte din analiza datelor formată din două etape: model care reprezintă datele.

  1. Asigurați-vă că modelul se potrivește eficient cu datele.

  2. Netezirea datelor se concentrează asupra stabilirii unei direcții fundamentale pentru punctele de bază prin (1) ignorarea oricărui punct de date zgomotos și (2) desenarea unei curbe mai fine prin punctele de date care sări peste cele care scot și accentuează tendințele primare - datele, indiferent cât de lent este apariția lor. În consecință, într-o serie numerică de timp, netezirea datelor servește ca o formă de filtrare.

Netezirea datelor poate utiliza oricare din următoarele metode:

Păcatul aleatoriu

  • se bazează pe ideea că următorul rezultat sau viitorul punct de date este o abatere aleatorie de la ultimul punct cunoscut sau prezent. Media de deplasare

  • este o medie medie a perioadelor consecutive, egal distanțate. Un exemplu ar fi calcularea unei medii mobile de 200 de zile a prețului acțiunilor. Netezirea exponențială

  • atribuie exponențial mai multă greutate sau importanță punctelor recente de date decât punctelor de date mai vechi. Simplu:

    • Această metodă trebuie utilizată atunci când datele din seria de timp nu au tendință și nici sezonalitate. Linear:

    • Această metodă trebuie utilizată atunci când datele din seria de timp au o linie de trend. Sezonier:

    • Această metodă ar trebui utilizată atunci când datele din seria de timp nu au nici o tendință, ci sezonalitate. Toate aceste metode de uniformizare au în comun că realizează un fel de proces de mediere pe mai multe puncte de date. O astfel de medie a punctelor de date adiacente este modalitatea esențială de a zero în tendințele sau modelele de bază.

Avantajele de netezire a datelor sunt

Este ușor de implementat.

  • Ajută la identificarea tendințelor.

  • Ajută la expunerea modelelor în date.

  • elimină punctele de date pe care le-ați decis că nu prezintă interes.

  • Ajută la prezicerea direcției generale a următoarelor puncte de date observate.

  • Se generează grafice frumoase netede.

  • Dar totul are un dezavantaj. Dezavantajele netezimii datelor sunt

Se pot elimina punctele de date valide care rezultă din evenimente extreme.

  • Poate duce la predicții inexacte dacă datele de testare sunt doar sezoniere și nu sunt pe deplin reprezentative pentru realitatea care a generat punctele de date.

  • Poate să schimbe sau să înclină datele, în special vârfurile, ducând la o imagine distorsionată a ceea ce se întâmplă.

  • Poate fi vulnerabil la perturbări semnificative de la valori excepționale din cadrul datelor.

  • Este posibil să se producă o deviere importantă de la datele originale.

  • Dacă netezirea datelor nu face altceva decât să dăm datele doar un facelift, putem trage o eroare fundamentală în următoarele moduri:

Poate introduce erori prin distorsiuni care tratează datele netezite ca și cum ar fi identice cu originalul date.

  • Poate denatura interpretarea prin ignorarea și ascunderea riscurilor încorporate în date.

  • Aceasta poate duce la pierderea detaliilor în datele dvs. - ceea ce reprezintă o modalitate prin care o curbă netezită se poate abate foarte mult de cea a datelor originale.

  • Cât de gravă este netezirea datelor care vă pot afecta datele depinde de natura datelor la îndemână și de ce tehnică de netezire a fost implementată pe aceste date.De exemplu, dacă datele inițiale au mai multe vârfuri, atunci netezirea datelor va duce la o schimbare majoră a acestor vârfuri în graficele netezite - cel mai probabil o denaturare.

Iată câteva puncte de avertizare pe care trebuie să le țineți minte pe măsură ce abordați netezirea datelor:

Este o idee bună să comparați graficele netezite cu graficele neatinsă care comportă datele originale.

  • Punctele de date eliminate în timpul netezirii datelor nu pot fi zgomote; acestea ar putea fi date valabile, reale care rezultă din evenimente rare, dar reale.

  • Netezirea datelor poate fi utila moderată, dar suprasolicitarea poate duce la o denaturare a datelor.

  • Aplicând expertiza profesională și expertiza cunoștințelor de afaceri, puteți utiliza în mod eficient o netezire a datelor. Eliminarea zgomotului din datele dvs. - fără a afecta negativ acuratețea și utilitatea datelor originale - este cel puțin o artă ca și știința.

Cum se utilizează Smoothing Data în Analytics Predictive - Dummy

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...