Video: Regresia liniară multiplă 2024
Modelul Markov este un model statistic care poate fi utilizat în analiza predictivă care se bazează în mare măsură pe teoria probabilităților. (Este numit după un matematician rus a cărui cercetare primară se afla în teoria probabilităților.)
Iată un scenariu practic care ilustrează modul în care funcționează: Imaginați-vă că doriți să anticipați dacă echipa X va câștiga mâine. Primul lucru pe care trebuie să-l faceți este să colectați statisticile anterioare despre Echipa X. Întrebarea care ar putea apărea este cât de mult înapoi ar trebui să mergeți în istorie?
Să presupunem că ai reușit să ajungi în ultimele 10 rezultate din joc în succesiune. Vrei să știi probabilitatea ca echipa X să câștige următorul meci, având în vedere rezultatele ultimelor 10 meciuri.
Problema este că, în continuare, înapoi în istoria pe care doriți să mergeți, mai greu și mai complex de colectare a datelor și de calcul probabilitate deveni.
Credeți sau nu, modelul Markov vă simplifică viața oferindu-vă Markov Assumption, care arată astfel atunci când scrieți-o cu cuvinte:
n , este aproximativ egal cu probabilitatea ca un astfel de eveniment să se întâmple dat doar ultimului eveniment trecut. Scrisă ca o formulă, Aspectul Markov arată astfel:În orice caz, asumarea lui Markov înseamnă că nu trebuie să mergeți prea departe în istorie pentru a prezice rezultatul de mâine. Puteți folosi doar cel mai recent eveniment trecut. Aceasta se numește predicția
a lui Markov de la primul rând deoarece considerați doar ultimul eveniment pentru a prezice evenimentul viitor.
predicție Markov de ordinul doi include doar ultimele două evenimente care au loc în succesiune. Din ecuația dată, se poate deduce și următoarea ecuație: Această ecuație își propune să calculeze probabilitatea ca unele evenimente să se întâmple succesiv:
eveniment 1 după eveniment 2 și așa mai departe. Această probabilitate poate fi calculată prin înmulțirea probabilității fiecărui eveniment t (dat fiind evenimentul precedent) de următorul eveniment din secvență. De exemplu, să presupunem că doriți să prezicați probabilitatea ca echipa X să câștige, apoi să-și piardă și apoi legăturile. Iată cum ar funcționa un model predictiv tipic bazat pe un model Markov. Luați în considerare același exemplu: să presupunem că doriți să prezicați rezultatele unui joc de fotbal care va fi jucat de către echipa X. Cele trei rezultate posibile - denumite
state - sunt câștig, pierdere sau cravată. Să presupunem că ați colectat date statistice trecute despre rezultatele jocurilor de fotbal ale echipei X și că echipa X a pierdut cel mai recent joc. Vrei să preziceți rezultatul următorului joc de fotbal. Este vorba despre a ghici dacă echipa X va câștiga, pierde sau cravata - bazându-se numai pe datele din jocurile anterioare. Deci, iată cum folosiți modelul Markov pentru a face această previziune.
Calculați unele probabilități pe baza datelor anterioare.
-
De exemplu, de câte ori echipa X a pierdut jocuri? De câte ori echipa X a câștigat jocuri? De exemplu, imaginați-vă dacă echipa X a câștigat 6 jocuri din zece jocuri în total. Apoi, echipa X a câștigat 60% din timp. Cu alte cuvinte, probabilitatea de a câștiga pentru echipa X este de 60%.
Calculați probabilitatea unei pierderi și apoi probabilitatea unei cravate în același mod.
-
Utilizați ecuația de probabilitate Naïve Bayes pentru a calcula probabilitățile cum ar fi:
-
Probabilitatea ca echipa X să câștige, dat fiind că echipa X a pierdut ultimul joc.
-
Probabilitatea că echipa X va pierde, dat fiind că echipa X a câștigat ultimul joc.
-
Calculați probabilitățile pentru fiecare stat (câștig, pierdere sau cravată).
-
-
Presupunând că echipa joacă un singur joc pe zi, probabilitățile sunt după cum urmează:
-
P (Win | Loss) este probabilitatea ca echipa X să câștige astăzi, dat fiind că a pierdut ieri.
-
P (Win | Tie) este probabilitatea ca echipa X să câștige astăzi, având în vedere că a legat ieri.
-
P (Win | Win) este probabilitatea ca echipa X să câștige astăzi, dat fiind că a câștigat ieri.
-
Folosind probabilitățile calculate, creați o diagramă.
-
-
Un cerc din această diagramă reprezintă o posibilă stare pe care echipa X o poate atinge la un moment dat (câștig, pierdere, cravată); numerele de pe săgeți reprezintă probabilitățile pe care Echipa X le-ar putea muta de la o stare la alta.
De exemplu, dacă echipa X tocmai a câștigat astăzi jocul (starea sa actuală), probabilitatea ca echipa să câștige din nou este de 60%; probabilitatea că vor pierde următorul joc este de 20% (caz în care ar trece de la starea actuală până la starea viitoare = pierderea).
Să presupunem că vrei să știi șansele ca echipa X să câștige două jocuri la rând și să-și piardă a treia. După cum vă puteți imagina, nu este o predicție directă de făcut.
Cu toate acestea, folosind diagrama creată și presupunerea lui Markov, puteți anticipa cu ușurință șansele unui astfel de eveniment să apară. Începeți cu statul de câștig, treceți din nou prin câștigând statul și înregistrați 60%; apoi treceți la starea de pierdere și înregistrați 20%.
Șansele ca echipa X să câștige de două ori și să piardă al treilea joc devin ușor de calculat: 60% ori 60% ori 20% 60% * 60% * 20%, ceea ce înseamnă 72%.
Deci, care sunt sansele ca echipa X să câștige, apoi să cravată și apoi să piardă de două ori după asta? Răspunsul este de 20% (trecând de la statul de câștig la statul de legătură) de 20% (trecând de la cravată la pierderea), de 35% (trecând de la pierdere la pierdere) de 35% (trecând de la pierdere la pierdere). Rezultatul este de 49%.