非一致有界费用MDP的强平均最优性条件

运筹学学报 ›› 2010, Vol. 14 ›› Issue (1): 95-105.

非一致有界费用MDP的强平均最优性条件

肖晴初, 谭杭生

出版日期:2010-03-15 发布日期:2010-03-15

A Condition for Strong Average Optimality of MDP with Non-uniformly Bounded Costs

XIAO Qing-Chu, TAN Hang-Sheng

Online:2010-03-15 Published:2010-03-15

摘要/Abstract

摘要： 研究可数状态空间任意行动空间非一致性有界费用马氏决策过程(MDP)的强平均最优，给出了使得每个常用的平均最优策略也是强平均最优的条件，并实质性的推广了Cavazos-Cadena和Fernandez-Gaucheran(Math. Meth. Oper. Res., 1996, 43: 281-300)的主要结果.

肖晴初, 谭杭生. 非一致有界费用MDP的强平均最优性条件[J]. 运筹学学报, 2010, 14(1): 95-105.

XIAO Qing-Chu, TAN Hang-Sheng. A Condition for Strong Average Optimality of MDP with Non-uniformly Bounded Costs[J]. Operations Research Transactions, 2010, 14(1): 95-105.

非一致有界费用MDP的强平均最优性条件

A Condition for Strong Average Optimality of MDP with Non-uniformly Bounded Costs

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

编辑推荐

Metrics

本文评价