所有版本 - 学术资源搜索

文章

学术资源搜索

获得 3 条结果（用时0.02秒）

D4rl: Datasets for deep data-driven reinforcement learning

J Fu, A Kumar, O Nachum, G Tucker… - arXiv preprint arXiv …, 2020 - arxiv.org

The offline reinforcement learning (RL) setting (also known as full batch RL), where a policy
is learned from a static dataset, is compelling as progress enables RL methods to take …

被引用次数：979 相关文章

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

J Fu, A Kumar, O Nachum, G Tucker… - arXiv e-prints, 2020 - ui.adsabs.harvard.edu

The offline reinforcement learning (RL) setting (also known as full batch RL), where a policy
is learned from a static dataset, is compelling as progress enables RL methods to take …

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

J Fu, A Kumar, O Nachum, G Tucker, S Levine - openreview.net

The offline reinforcement learning (RL) problem, also known as batch RL, refers to the
setting where a policy must be learned from a static dataset, without additional online data …

高级搜索

QQ 群

D4rl: Datasets for deep data-driven reinforcement learning

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

引用