摘要: 本文把博弈学习虚拟行动规则的学习时间一般化,研究不完全学习过程中参与人策略选择的收敛性及效用一致性问题. 分析结果表明:当学习时间不完全时,在学习一致到达的条件下,虚拟行动规则对严格纳什均衡是吸收的; 在学习时间充分及时与虚拟行动非频繁转换的条件下,各参与人的虚拟行动具有效用一致性.
丁占文, 蔡超英, 杨宏林, 蒋书敏. 不完全博弈学习过程的虚拟行动规则[J]. 运筹学学报, 2010, 14(3): 91-100.
DING Zhan-Wen, CAI Chao-Ying, YANG Hong-Lin, JIANG Shu-Min. Rule of Fictitious Play in the Learning Process with Incomplete Learning Times[J]. Operations Research Transactions, 2010, 14(3): 91-100.