Bc. Martin Kurečka

Master's thesis

Pareto Front Estimation in Risk-Constrained Markov Decision Processes

Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Abstract:
Předmětem práce je optimalizace Markovovských rozhodovacích procesů s omezením (CMDP) pomocí metody MCTS. Cílem CMDP je nalézt strategii maximalizující odměnu při současném udržení penalizace pod předem danou hranicí. Náš přínos je dvojí. Za prvé podrobně zkoumáme stávající algoritmy založené na MCTS (jmenovitě CC-POMCP a RAMCP) a demonstrujeme koncepční problémy v jejich návrhu. Za druhé představujeme …more
Abstract:
The topic of the thesis is the optimisation of constrained Markov decision processes (CMDPs) using Monte Carlo tree search. CMDPs aim to find a control policy maximising a reward signal while keeping a penalty signal below a specified threshold. Our contribution is two-fold. Firstly, we provide a detailed examination of existing MCTS-based algorithms, CC-POMCP and RAMCP, and reveal and demonstrate …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 15. 12. 2023

Thesis defence

  • Date of defence: 14. 2. 2024
  • Supervisor: doc. RNDr. Petr Novotný, Ph.D.
  • Reader: doc. RNDr. Tomáš Brázdil, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky