Acasă Finanțe personale Modul de utilizare a modelului Markov în predictiv Analytics - manechine

Modul de utilizare a modelului Markov în predictiv Analytics - manechine

Video: Regresia liniară multiplă 2024

Video: Regresia liniară multiplă 2024
Anonim

Modelul Markov este un model statistic care poate fi utilizat în analiza predictivă care se bazează în mare măsură pe teoria probabilităților. (Este numit după un matematician rus a cărui cercetare primară se afla în teoria probabilităților.)

Iată un scenariu practic care ilustrează modul în care funcționează: Imaginați-vă că doriți să anticipați dacă echipa X va câștiga mâine. Primul lucru pe care trebuie să-l faceți este să colectați statisticile anterioare despre Echipa X. Întrebarea care ar putea apărea este cât de mult înapoi ar trebui să mergeți în istorie?

Să presupunem că ai reușit să ajungi în ultimele 10 rezultate din joc în succesiune. Vrei să știi probabilitatea ca echipa X să câștige următorul meci, având în vedere rezultatele ultimelor 10 meciuri.

Problema este că, în continuare, înapoi în istoria pe care doriți să mergeți, mai greu și mai complex de colectare a datelor și de calcul probabilitate deveni.

Credeți sau nu, modelul Markov vă simplifică viața oferindu-vă Markov Assumption, care arată astfel atunci când scrieți-o cu cuvinte:

n , este aproximativ egal cu probabilitatea ca un astfel de eveniment să se întâmple dat doar ultimului eveniment trecut. Scrisă ca o formulă, Aspectul Markov arată astfel:

În orice caz, asumarea lui Markov înseamnă că nu trebuie să mergeți prea departe în istorie pentru a prezice rezultatul de mâine. Puteți folosi doar cel mai recent eveniment trecut. Aceasta se numește predicția

a lui Markov de la primul rând deoarece considerați doar ultimul eveniment pentru a prezice evenimentul viitor.

O

predicție Markov de ordinul doi include doar ultimele două evenimente care au loc în succesiune. Din ecuația dată, se poate deduce și următoarea ecuație: Această ecuație își propune să calculeze probabilitatea ca unele evenimente să se întâmple succesiv:

eveniment 1 după eveniment 2 și așa mai departe. Această probabilitate poate fi calculată prin înmulțirea probabilității fiecărui eveniment t (dat fiind evenimentul precedent) de următorul eveniment din secvență. De exemplu, să presupunem că doriți să prezicați probabilitatea ca echipa X să câștige, apoi să-și piardă și apoi legăturile. Iată cum ar funcționa un model predictiv tipic bazat pe un model Markov. Luați în considerare același exemplu: să presupunem că doriți să prezicați rezultatele unui joc de fotbal care va fi jucat de către echipa X. Cele trei rezultate posibile - denumite

state - sunt câștig, pierdere sau cravată. Să presupunem că ați colectat date statistice trecute despre rezultatele jocurilor de fotbal ale echipei X și că echipa X a pierdut cel mai recent joc. Vrei să preziceți rezultatul următorului joc de fotbal. Este vorba despre a ghici dacă echipa X va câștiga, pierde sau cravata - bazându-se numai pe datele din jocurile anterioare. Deci, iată cum folosiți modelul Markov pentru a face această previziune.

Calculați unele probabilități pe baza datelor anterioare.

  1. De exemplu, de câte ori echipa X a pierdut jocuri? De câte ori echipa X a câștigat jocuri? De exemplu, imaginați-vă dacă echipa X a câștigat 6 jocuri din zece jocuri în total. Apoi, echipa X a câștigat 60% din timp. Cu alte cuvinte, probabilitatea de a câștiga pentru echipa X este de 60%.

    Calculați probabilitatea unei pierderi și apoi probabilitatea unei cravate în același mod.

  2. Utilizați ecuația de probabilitate Naïve Bayes pentru a calcula probabilitățile cum ar fi:

  3. Probabilitatea ca echipa X să câștige, dat fiind că echipa X a pierdut ultimul joc.

    • Probabilitatea că echipa X va pierde, dat fiind că echipa X a câștigat ultimul joc.

    • Calculați probabilitățile pentru fiecare stat (câștig, pierdere sau cravată).

  4. Presupunând că echipa joacă un singur joc pe zi, probabilitățile sunt după cum urmează:

  5. P (Win | Loss) este probabilitatea ca echipa X să câștige astăzi, dat fiind că a pierdut ieri.

    • P (Win | Tie) este probabilitatea ca echipa X să câștige astăzi, având în vedere că a legat ieri.

    • P (Win | Win) este probabilitatea ca echipa X să câștige astăzi, dat fiind că a câștigat ieri.

    • Folosind probabilitățile calculate, creați o diagramă.

  6. Un cerc din această diagramă reprezintă o posibilă stare pe care echipa X o poate atinge la un moment dat (câștig, pierdere, cravată); numerele de pe săgeți reprezintă probabilitățile pe care Echipa X le-ar putea muta de la o stare la alta.

    De exemplu, dacă echipa X tocmai a câștigat astăzi jocul (starea sa actuală), probabilitatea ca echipa să câștige din nou este de 60%; probabilitatea că vor pierde următorul joc este de 20% (caz în care ar trece de la starea actuală până la starea viitoare = pierderea).

Să presupunem că vrei să știi șansele ca echipa X să câștige două jocuri la rând și să-și piardă a treia. După cum vă puteți imagina, nu este o predicție directă de făcut.

Cu toate acestea, folosind diagrama creată și presupunerea lui Markov, puteți anticipa cu ușurință șansele unui astfel de eveniment să apară. Începeți cu statul de câștig, treceți din nou prin câștigând statul și înregistrați 60%; apoi treceți la starea de pierdere și înregistrați 20%.

Șansele ca echipa X să câștige de două ori și să piardă al treilea joc devin ușor de calculat: 60% ori 60% ori 20% 60% * 60% * 20%, ceea ce înseamnă 72%.

Deci, care sunt sansele ca echipa X să câștige, apoi să cravată și apoi să piardă de două ori după asta? Răspunsul este de 20% (trecând de la statul de câștig la statul de legătură) de 20% (trecând de la cravată la pierderea), de 35% (trecând de la pierdere la pierdere) de 35% (trecând de la pierdere la pierdere). Rezultatul este de 49%.

Modul de utilizare a modelului Markov în predictiv Analytics - manechine

Alegerea editorilor

Evaluarea Vizualizărilor de date - dummies

Evaluarea Vizualizărilor de date - dummies

Vizualizările de date pot fi foarte colorate și impresionante. Dar amintiți-vă că cheia pentru crearea unor vizualizări eficiente de date nu depinde de faptul dacă este interesantă, ci mai degrabă de faptul dacă descoperă problemele reale de afaceri care trebuie abordate. O foaie de lucru vă ajută să creați propriile vizualizări de date sau să evaluați creațiile altora. Aici ...

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Determinarea programului care funcționează cel mai bine pentru nevoile tale informatice

Să lucreze mai bine decât celălalt. În timp, veți dezvolta un sentiment dacă Illustrator sau Photoshop se potrivesc mai bine pentru diverse sarcini. Până atunci, iată un exemplu despre modul în care fiecare program gestionează diferite elemente ale lucrării de design grafic. Graphing Photoshop nu este un program de grafic. Tu ...

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografice nevergreen: Închirierea obiectelor Build - dummies

Infografics evergreen nu sunt legate de niciun eveniment sau persoană în știri . Ele nu au o componentă sezonieră și nu sunt legate de ceva în timp util. O infographic despre cum se fac CD-urile se va aplica pentru că este vorba de muzică, dar nu este specifică nici unui artist sau gen. Cu infografiile veșnic verzi, ignorați complet evenimentele curente și explorați ideile ...

Alegerea editorilor

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Utilizați Zoom în Adobe Photoshop CS5 - manechine

Adobe Creative Suite 5 oferă scurtături pentru Zooming în Photoshop. Imaginile care arată bine la un nivel de zoom pot părea extrem de proaste la altul. Veți mări și micșora destul de des în timp ce lucrați la imagini în Photoshop. Puteți găsi opțiuni de meniu pentru zoom în meniul Vizualizare; o modalitate mai rapidă de a mări este ...

Text în Photoshop CC - dummies

Text în Photoshop CC - dummies

Când editați o imagine cu text în Photoshop CC, puteți schimba linia care fluxul dvs. de tip fie folosind funcția Warp Text sau tastând pe o cale. Tipul de deformare utilizează forme predefinite la care se formează tipul dvs. (și poate fi utilizat atât cu tipul de punct, cât și cu paragraful) și tastând ...

Alegerea editorilor

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cum se adaugă Biblioteca RegEx în C ++ - dummies

Cea mai mare parte a bibliotecii Boost funcționează bine adăugând la codul aplicației. Cu toate acestea, câteva componente, cum ar fi RegEx, necesită o bibliotecă. Înainte de a putea folosi o bibliotecă, trebuie să o construiți. După ce ați construit biblioteca, trebuie să o adăugați în aplicație. Există două tehnici de adăugare a ...

Cum Heap Works în C ++ - dummies

Cum Heap Works în C ++ - dummies

Halda este un bloc amorf de memorie pe care programul C ++ îl poate accesa după cum este necesar. Aflați de ce există și cum se utilizează. Așa cum este posibil să treci un pointer la o funcție, este posibil ca o funcție să returneze un pointer. O funcție care returnează adresa ...

Cum să evitați codul de injectare în C ++ - dummies

Cum să evitați codul de injectare în C ++ - dummies

Prima regulă de evitare a codului injectat în programele C ++ , permiterea prelucrării datelor de către un interpret de limbă cu scop general. O eroare obișnuită cu SQL-injectarea este că programul acceptă intrarea utilizatorului ca și cum ar fi fost întotdeauna acceptabilă și îl inserează într-o interogare SQL pe care o trimite apoi la ...