多智能体博弈, 学习与控制

王龙, 黄锋 - 自动化学报, 2023 - aas.net.cn
… Learning enables adaptation in cooperation for multi-player stochastic games. Journal of …
Multiplayer Stackelberg-Nash game for nonlinear system via value iteration-based integral …

[HTML][HTML] 基于博弈论的多车智能驾驶交互决策综述

衣鹏, 潘越, 王文远, 刘政钦, 洪奕光 - 2023 - kzyjc.alljournals.cn
Iterative linear quadratic regulator design for nonlinear biological movement systems[C].
International Conference on Informatics in Control, Automation and Robotics(ICINCO). Setúbal: …

[HTML][HTML] 强化学习与自适应动态规划: 从基础理论到多智能体系统中的应用进展综述

温广辉, 杨涛, 周佳玲, 付俊杰, 徐磊 - 控制与决策, 2023 - kzyjc.alljournals.cn
… (generalized policy iteration, GPI)算法 [5] , 算法实施中策略评估与策略改进两个流程以某种
粒度交替进行.在这一框架下, 策略迭代(policy iteration, PI)算法 [5] 和值迭代(value iteration, VI)…

基于动态博弈算法的切入场景下自动驾驶车辆运动规划研究

兰凤崇, 刘迎节, 陈吉清, 刘照麟 - 汽车工程, 2023 - qichegongcheng.com
Efficient iterative linear-quadratic approximations for nonlinear multiplayer general-sum
differential games[C]. 2020 IEEE Interna⁃ tional Conference on Robotics and Automation (ICRA)…