所有版本 - 学术资源搜索

A reinforcement learning algorithm based on policy iteration for average reward: Empirical results with yield management and convergence analysis

A Gosavi - Machine Learning, 2004 - Springer

Abstract We present a Reinforcement Learning (RL) algorithm based on policy iteration for
solving average reward Markov and semi-Markov decision problems. In the literature on …

被引用次数：121 相关文章

[PDF] academia.edu

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - academia.edu

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Gosavi - Machine Learning, 2004 - dl.acm.org

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - elibrary.ru

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

[PDF] mst.edu

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - mst.edu

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Gosavi - Machine Learning, 2004 - infona.pl

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

[PDF] psu.edu

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - Citeseer

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

[引用][C] A Reinforcement Learning Algorithm Based on Policy Iteration For Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - cir.nii.ac.jp

A Reinforcement Learning Algorithm Based on Policy Iteration For Average Reward : Empirical
Results with Yield Management and Convergence Analysis | CiNii Research CiNii 国立情報学 …

[PDF] simoptim.com

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A GOSAVI - Machine Learning, 2004 - simoptim.com

We present a Reinforcement Learning (RL) algorithm based on policy iteration for solving
average reward Markov and semi-Markov decision problems. In the literature on discounted …

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis.

A Gosavi - Machine Learning, 2004 - psycnet.apa.org

Abstract We present a Reinforcement Learning (RL) algorithm based on policy iteration for
solving average reward Markov and semi-Markov decision problems. In the literature on …

高级搜索

QQ 群

A reinforcement learning algorithm based on policy iteration for average reward: Empirical results with yield management and convergence analysis

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

[引用][C] A Reinforcement Learning Algorithm Based on Policy Iteration For Average Reward: Empirical Results with Yield Management and Convergence Analysis

[PDF][PDF] A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward: Empirical Results with Yield Management and Convergence Analysis.

引用