摘要: 研究可数状态空间任意行动空间非一致性有界费用马氏决策过程(MDP)的强平均最优,给 出了使得每个常用的平均最优策略也是强平均最优的条件,并实质性的推广了Cavazos-Cadena和Fernandez-Gaucheran(Math. Meth. Oper. Res., 1996, 43: 281-300)的主要结果.
肖晴初, 谭杭生. 非一致有界费用MDP的强平均最优性条件[J]. 运筹学学报, 2010, 14(1): 95-105.
XIAO Qing-Chu, TAN Hang-Sheng. A Condition for Strong Average Optimality of MDP with Non-uniformly Bounded Costs[J]. Operations Research Transactions, 2010, 14(1): 95-105.