Swarm Reinforcement Learning Method for Multi-agent Tasks—Solution of Dilemma Problems—

S Yamawake, Y Kuroe, H Iima - … of the Society of Instrument and …, 2013 - jstage.jst.go.jp
In this paper, we propose a swarm reinforcement learning method for dilemma problems of
multi-agent tasks in which it is difficult for agents to learn cooperative actions. In the …

エージェント-環境間相互作用~ 強化学習の立場からの再考~

宮崎和光, 山口智浩 - 計測と制御, 2005 - jstage.jst.go.jp
強化学習とは, 報 酬や罰 といった強化信号 という学習のフイー ドバ ック情報を手がか りに, 学
習主体 (エ ージェント) が 環境との相互作用を通 した行動の結果か ら学ぶ機械学習の一手法で …

マルチエージェントタスクに対する群強化学習法

山分翔太, 黒江康明 - 計測自動制御学会論文集, 2013 - jlc.jst.go.jp
In this paper, we propose a swarm reinforcement learning method for dilemma problems of
multi-agent tasks in which it is difficult for agents to learn cooperative actions. In the …

強化学習と情動学習に基づく意思決定法: 利己的な判断による協調行動の創発

三澤秀明, 松田充史, 堀尾恵一 - 知能と情報, 2012 - jstage.jst.go.jp
抄録 情動は, 動物が生存していく上で非常に重要な要素であり, 社会的な意思決定にも関係して
いると考えられている. 本論文では, 恐怖情動に基づく利己的な判断による社会的行動の創発を検証 …

環境の変化に適応するマルチエージェントの学習手法

今福啓 - 人工知能学会論文誌, 2006 - jstage.jst.go.jp
抄録 In this paper, several agents construct the multi-agent system, and each agent defines
its action to maximize the reward that can obtain from the environment without …

マルチエージェントシステムにおける利他的な行動規則の獲得

上田祐彰, 谷澤俊彰, 高橋健一… - 電子情報通信学会論文誌 …, 2005 - search.ieice.org
マルチエージェントシステムにおける利他的な行動規則の獲得手法について論じる.
はじめにタスク割当問題を定義し, この問題において公平にタスクを分担するような行動規則を獲得 …

我らが将来に持続可能社会はあるのか?

谷本潤, 藤井晴行 - 日本建築学会環境系論文集, 2004 - jstage.jst.go.jp
抄録 To induce whether we can obtain a sustainable society shifting our paradigm from the
materialism to the eco-conscious idea, a multi agent simulation model was established. The …

[PDF][PDF] 強化学習と情動学習を用いた迷路探索問題の最適化

R SHIMOJO, Y YAMAUCHI - cit.nihon-u.ac.jp
1 まえがきロボット技術の進展によって, 産業用ロボットに加え, 人間の生活環境内で作業を行う
ロボットが精力的に開発されている. 人間と同じ生活環境で共生するロボットには …

[PDF][PDF] 強化学習における学習器の多重化に関する研究

西澤智恵子, ニシザワチエコ - 2019 - mie-u.repo.nii.ac.jp
3.1 提案手法 (二重化版) の NS チャート................... 23 3.2 シミュレーション環境.......................... 24
3.3 ケース 1: 学習環境の全てを部分空間のみで表現できる場合の環境.. 27 3.4 ケース 2 …

学習空間を全体空間とその部分空間で二重化する強化学習法

松井博和, 西澤智恵子, 野村由司彦 - 日本ロボット学会誌, 2019 - jstage.jst.go.jp
抄録 In this paper, we propose a Q-learning method by using dual Q-table. Concretely, the
proposed method has two Q-tables:“Whole Q-table''is larger, based on the whole space (in …