CSpace

浏览/检索结果: 共5条,第1-5条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Nonhomogeneous Markov decision processes with Borel state space - The average criterion with nonuniformly bounded rewards 期刊论文
MATHEMATICS OF OPERATIONS RESEARCH, 2000, 卷号: 25, 期号: 4, 页码: 667-678
作者:  Guo, XP;  Liu, JY;  Liu, K
收藏  |  浏览/下载:118/0  |  提交时间:2018/07/30
nonhomogeneous Markov decision processes  average reward criterion  optimality equations  epsilon(>= 0)-optimal policies  rolling horizon algorithm  
非平稳MDP平均模型及其滚动式算法 期刊论文
系统科学与数学, 1999, 卷号: 019, 期号: 004, 页码: 439
作者:  郭先平;  刘克;  刘建庸
收藏  |  浏览/下载:121/0  |  提交时间:2020/01/10
部分可观察马尔可夫决策规划—首达目标模型 期刊论文
应用数学学报, 1994, 卷号: 017, 期号: 001, 页码: 44
作者:  刘迪芬;  刘建庸;  刘克
收藏  |  浏览/下载:43/0  |  提交时间:2020/01/10
无限阶段部分可观察马尔可夫决策规划 期刊论文
高校应用数学学报a辑, 1993, 卷号: 000, 期号: 002, 页码: 210
作者:  刘迪芬;  刘克;  刘建庸
收藏  |  浏览/下载:46/0  |  提交时间:2020/01/10
MARKOVIAN DECISION PROGRAMMING WITH RECURSIVE REWARD FUNCTIONS 期刊论文
KEXUE TONGBAO, 1988, 卷号: 33, 期号: 14, 页码: 1229-1230
作者:  LIU, JY;  LIU, K
收藏  |  浏览/下载:90/0  |  提交时间:2018/07/30