Reduced policy optimization for continuous control with hard constraints

文章

学术资源搜索

获得 1 条结果（用时0.03秒）

我的图书馆

Reduced policy optimization for continuous control with hard constraints

在引用文章中搜索

[PDF] arxiv.org

SaVeR: Optimal Data Collection Strategy for Safe Policy Evaluation in Tabular MDP

S Mukherjee, JP Hanna, R Nowak - arXiv preprint arXiv:2406.02165, 2024 - arxiv.org

In this paper, we study safe data collection for the purpose of policy evaluation in tabular
Markov decision processes (MDPs). In policy evaluation, we are given a\textit {target} policy …

高级搜索

QQ 群

Reduced policy optimization for continuous control with hard constraints

SaVeR: Optimal Data Collection Strategy for Safe Policy Evaluation in Tabular MDP

引用