Reinforcement learning with options in semi Markov decision processes

Goswami, Sayan

Inici
→
Treballs d'estudiants
→
Tecnologies de la Informació i les Comunicacions
→
Treballs de recerca de màster
→
Visualitza element

Reinforcement learning with options in semi Markov decision processes

Tipus de document: Treball d'investigació/Fi de màster

Data de publicació: 2021-09

Aquest document està subjecte a una llicència Creative Commons

Reconeixement-CompartirIgual 4.0 Internacional

Nom: TFM_Sayan.pdf

Grandària: 2.856Mb

Format: PDF

Visualitzar/Obrir

Citació: Goswami, Sayan. Reinforcement learning with options in semi Markov decision processes. 2021
http://hdl.handle.net/10230/49225

Enllaç permanent: http://hdl.handle.net/10230/49225

Descripció:

Tutors: Anders Jonsson i M. Sadegh Talebi

Treball fi de màster de: Master in Intelligent Interactive Systems

Resum:

The options framework incorporates temporally extended actions (termed options) to the reinforcement learning paradigm. A wide variety of prior works exist that experimentally illustrate the significance of options on the performance of a learning algorithm in a complex domains. However, the work by Fruit et al. on the semi-Markov Decision Process (SMDP) version of the UCRL2 algorithm introduced a formal understanding of circumstance that make options conducive to the performance of a learning ...

Autoria: Goswami, Sayan

Mostra el registre complet de l'element