Learning Reward for Robot Skills Using Large Language Models via Self-Alignment

文章

学术资源搜索

获得 2 条结果（用时0.02秒）

我的图书馆

Learning Reward for Robot Skills Using Large Language Models via Self-Alignment

在引用文章中搜索

[PDF] arxiv.org

DAG-Plan: Generating Directed Acyclic Dependency Graphs for Dual-Arm Cooperative Planning

Z Gao, Y Mu, J Qu, M Hu, L Guo, P Luo, Y Lu - arXiv preprint arXiv …, 2024 - arxiv.org

Dual-arm robots offer enhanced versatility and efficiency over single-arm counterparts by
enabling concurrent manipulation of multiple objects or cooperative execution of tasks using …

被引用次数：2 相关文章

[PDF] arxiv.org

Large Language Models as Efficient Reward Function Searchers for Custom-Environment Multi-Objective Reinforcement Learning

G Xie, J Xu, Y Yang, S Zhang - arXiv preprint arXiv:2409.02428, 2024 - arxiv.org

Leveraging large language models (LLMs) for designing reward functions demonstrates
significant potential. However, achieving effective design and improvement of reward …

高级搜索

QQ 群

Learning Reward for Robot Skills Using Large Language Models via Self-Alignment

DAG-Plan: Generating Directed Acyclic Dependency Graphs for Dual-Arm Cooperative Planning

Large Language Models as Efficient Reward Function Searchers for Custom-Environment Multi-Objective Reinforcement Learning

引用