Koti kehitys Mikä on Markovin päätöksentekoprosessi (mdp)? - määritelmä techopediasta

Mikä on Markovin päätöksentekoprosessi (mdp)? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - Mitä Markov-päätöksentekoprosessi (MDP) tarkoittaa?

Markovin päätöksentekoprosessi (MDP) on jotain, jota ammattilaiset kutsuvat "erilliseksi ajallinen stokastinen ohjausprosessi". Se perustuu matematiikkaan, jota venäläinen akateemikko Andrey Markov oli kehittänyt 19. vuosisadan lopulla ja 20. vuosisadan alkupuolella.

Techopedia selittää Markov-päätöksentekoprosessin (MDP)

Yksi tapa selittää Markovin päätöksentekoprosessia ja siihen liittyviä Markov-ketjuja on, että nämä ovat nykyaikaisen peliteorian elementtejä, jotka perustuvat venäläisen tutkijan yksinkertaisempaan matemaattiseen tutkimukseen sata vuotta sitten. Markovin päätöksentekoprosessin kuvaus on, että siinä tutkitaan skenaariota, jossa järjestelmä on tietyissä valtioissa, ja siirrytään eteenpäin toiseen tilaan päätöksentekijän päätösten perusteella.

Markovin ketju mallina näyttää tapahtumien jakson, jossa tietyn tapahtuman todennäköisyys riippuu aiemmin saavutetusta tilasta. Asiantuntijat voivat puhua ”laskettavasta tilatilasta” kuvaaessaan Markovin päätöksentekoprosessia - jotkut yhdistävät Markovin päätöksentekomallin idean ”satunnaisen kävelän” -malliin tai muuhun todennäköisyysperusteisiin perustuvaan stokastiseen malliin (satunnaisen kävelymallin, jota usein mainitaan seinällä Street, mallintaa oman pääoman liikettä ylös- tai alaspäin markkinoiden todennäköisyyden yhteydessä).

Markovin päätöksentekoprosesseja käytetään yleensä joihinkin edistyneimpiin tekniikoihin, joita ammattilaiset työskentelevät nykyään, esimerkiksi robottiikkaan, automaatioon ja tutkimusmalleihin.

Mikä on Markovin päätöksentekoprosessi (mdp)? - määritelmä techopediasta