Natural Policy Gradient for Exponential Families

文章

学术资源搜索

获得 1 条结果（用时0.02秒）

我的图书馆

Natural Policy Gradient for Exponential Families

在引用文章中搜索

[PDF] arxiv.org

A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme

P Parmas, M Sugiyama - arXiv preprint arXiv:1910.06419, 2019 - arxiv.org

Reparameterization (RP) and likelihood ratio (LR) gradient estimators are used throughout
machine and reinforcement learning; however, they are usually explained as simple …

被引用次数：4 相关文章所有 2 个版本

高级搜索

QQ 群

Natural Policy Gradient for Exponential Families

A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme

引用