Efficient model-based concave utility reinforcement learning through greedy mirror descent

文章

学术资源搜索

获得 1 条结果（用时0.04秒）

我的图书馆

Efficient model-based concave utility reinforcement learning through greedy mirror descent

在引用文章中搜索

[PDF] arxiv.org

MetaCURL: Non-stationary Concave Utility Reinforcement Learning

BM Moreno, M Brégère, P Gaillard… - arXiv preprint arXiv …, 2024 - arxiv.org

We explore online learning in episodic loop-free Markov decision processes on non-
stationary environments (changing losses and probability transitions). Our focus is on the …

高级搜索

QQ 群

Efficient model-based concave utility reinforcement learning through greedy mirror descent

MetaCURL: Non-stationary Concave Utility Reinforcement Learning

引用