庆贺俞建教授80华诞专辑
本文的目的是建立刻画区块链生态系统行为表现的“共识博弈”的一般框架, 并针对“矿池间隔博弈”的“共识均衡”的存在性进行刻画和解读。特别是通过引进共识博弈这个新概念作为出发点, 尽管区块链平台生态本身会受到诸如挖矿间隔等行为的干扰, 我们证明了在合理的激励机制下一般区块链平台的共识博弈均衡点的存在性, 从正面的角度回答了区块链生态本身发展是否稳定这个非常基本和核心的问题。这里, “间隔博弈”(不良) 行为出现所在的区块链生态是指基于 Nakamoto 在 2008 年提出的遵循按照最长主链建设的“工作量证明”作为基本的共识原则的挖矿平台。特别地, 本文首先在一般激励机制条件下, 基于区块链生态中的共识博弈框架, 在有挖矿间隔等不良行为出现的情况下, 建立了在一般激励相容机制条件下的共识均衡点的存在性结果和对应区块链生态能够持续运转的稳定性解读; 然后结合在“挖(币) 矿”工作中涉及到的工作费用、奖励机制和挖矿能力这三类描述激励机制的核心要素, 从挖矿工(组) 收益的角度, 针对不同嵌入场景对挖矿工(组) 的“间隔博弈行为”可能产生的影响进行了解读和分析。本文的理论结果和案例分析表明, 结合不同挖矿场景相合适的激励相容机制, 共识博弈(均衡) 这个概念可以在理论的层面(即, 不需要情景数据模拟结果的支持), 能够得到或形成针对不同场景下的挖矿行为的解释和解读。此外, 我们有理由期待和相信, 结合影响挖矿(组) 收益相关的要素因子, 共识博弈可以帮助我们构建对应的合适场景的激励相容机制, 通过刻画挖矿工(组) 出现的诸如“间隔行为”, “分叉链”, “矿池攻击”等(不良) 行为, 支撑数字经济的健康发展, 并对共识经济学基础理论的发展能够起到推进作用。
群体博弈理论是近三十年来发展起来的博弈论的新方向, 源于1950年J. Nash在其博士学位论文中关于有限非合作博弈混合策略和平衡点的“Mass-Action”解释, 建立了由众多个体组成的群体及社会中, 个体的理性决策行为理论, 在社会学、生物学、经济学、管理学、信息科学等领域有广泛和深入的应用。本文介绍近年来群体博弈理论的研究成果及新进展, 探讨群体博弈理论的发展动向。
本文以微分博弈和经典的追逃问题为主线, 对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题, 从平均场博弈视角出发, 阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点, 可适用于水下无人舰艇、陆地机器人以及空中无人机集群等同类场景。区别于其他综述性文章, 作者对于俄罗斯以及苏联在本领域发展历史中代表性的学术流派给予了较多关注。
随着全球经济融合和国际关系日益紧密, 合作共赢已然成为当今时代的核心趋势。合作博弈理论作为研究合作问题的有力工具, 主要探讨如何在参与者之间分配合作所产生的收益。Shapley值作为合作博弈中最重要的单值解之一, 具有重要研究意义与价值。本文将主要介绍目前Shapley值公理化的研究工作, 从可加性、均衡贡献性、边际性、公平性、简约一致性、相关一致性和一些特殊的参与者性的角度, 分别归纳整理了Shapley值基于这些性质的公理化研究结论。最后对未来研究进行了展望。
在排队系统中, 池化、去池化/专业化和自主完成任务是典型的运营操作策略, 这些策略在医疗保健、电话服务中心和线上销售中有广泛应用。这些策略在不同的操作环境中可能有优劣之分。本文使用$M/M/1$和$M/M/2$排队模型研究池化、专业化和自主完成任务对平均队列长度的影响。我们推导出$M/M/2$排队系统的平均队列长度的解析式。通过计算实例展示池化、专业化和自主完成任务如何影响平均队列长度的变化。最后, 本文提出了几个猜想。
本文研究了一个连续时间内部交易模型, 其中风险中性内部交易者拥有风险资产的两个不完全相关信号。利用条件期望理论和滤波理论, 首先, 本文建立了三个引理: 分别是正态相关性、等价定价和等价利润, 这三个引理能使得本文中非完全信息内部交易模型转换成完全信息的情形。其次, 本文研究了不完全相关的两个信号对由最优内部交易策略和市场半强有效性定价所组成的均衡的影响。研究表明, 在均衡状态下, (1)市场深度随时间变化是恒定的; (2)如果这两个相关私有信号的噪声不线性相关, 那么内部交易者的所有私人信息最终都会被纳入价格中, 但是风险资产的信息并不会完全被纳入价格中; (3)如果这两个相关私有信号的噪声线性相关, 那么内部交易者能够推断出风险资产的全部信息, 最终本文模型就转换成了内部交易者掌握风险资产全部信息的内部交易模型; (4)如果相关私有信号的噪声相同, 那么内部交易者的期望利润随着观察精度的降低会增加, 而随着观察精度越高, 内部交易者的期望利润也慢慢趋于0;(5)如果两个相关私有信号的噪声不线性相关, 那么在其中一个噪声信号固定的情况下, 内部交易者的期望利润是单峰的, 且相对于另一个相关噪声信号有唯一的最小值, 此外, 当相关私有信号的噪声变成0时, 内部交易者期望利润达到最大, 即内部交易者观察到了真实的风险资产。
在“3060”双碳战略目标下, 随着风电产业的迅速发展, 预防性维护已然成为提高风力发电机运行可靠性的重要手段。关于复杂环境下风力发电机的运行管理尚存在对退化状态认识不充分、维修策略不可靠等问题。本文以期望成本最小化为目的, 考虑风力发电机关键部件退化过程与多阶段预防性维护策略的关系, 构建基于Markov状态转移的多阶段预防性维护成本模型。首先, 依据设备衰退规律, 利用Markov链的转移概率对退化状态、维护策略进行刻画。其次, 引入可靠度、故障率、役龄因子计算多阶段预防性维护时长和故障时长; 再进一步考虑天气条件对维护成本模型的影响, 构建风力发电机在整个维护周期内的期望成本模型。最后, 利用数值分析对模型进行求解。结果表明, 实施最小、更换维护策略的期望成本占据了总维护成本的80%以上, 相比之下, 采取预防性维护优化策略的期望成本则低于总维护成本的20%, 故该策略可为低风速地区的风电企业提供有效的决策参考, 提高风力发电机的运行可靠性。
如何寻求公平合理的分配方案(即博弈的解)是合作博弈的重要研究内容, 依据博弈参与者边际贡献的分配原则和考虑参与者内在联系的社会性分配原则被广泛应用于博弈解的定义。不同的博弈组合解往往同时体现了这两类分配原则。针对现有组合解中组合参数的外生性以及缺乏合理性解释的问题, 本文利用博弈解的社会可接受性, 主要研究了基于Shapley值、Solidarity值、ENSC值以及均分值的两类组合解, 给出了组合解中参数范围选取的充分(必要)条件, 阐明了不同社会可接受性之间的关系, 揭示了组合系数对博弈参与者行为的影响。
均衡概念的提炼和形式化是博弈论学科创立的标志, 博弈论的发展是围绕各种均衡概念的基本性质展开的。一般认为, 均衡不存在是一个负面结果, 均衡不存在研究就没法推进。对于经济学研究而言也是如此。本文通过文献中非合作博弈和完全竞争市场中的两个例子说明, 有时候可以对均衡不存在给出有价值的解释。第一个例子通过网络硬币匹配博弈研究时尚现象的演化, 均衡不存在用来解读时尚周期的出现。第二个例子介绍的是完全竞争劳动力市场中公司与工人间的匹配问题, 均衡不存在用来解读提前签约现象。我们还简要介绍了Shapley关于效用可转移合作博弈核心为空集的精彩解读。
本文将研究具有加性耦合效用和连续统参与人博弈中的强Nash均衡。我们首先证明具有加性耦合效用和有限参与人博弈中强Nash均衡的存在性。进一步, 对具有加性耦合效用和连续统参与人的博弈, 我们引入弱强Nash均衡的概念, 并证明它的存在性定理。本文发展了强Nash均衡的研究。
本文研究了不连续向量支付博弈α-核的存在性和稳定性, 提出了向量支付博弈的联盟最小值条件和向量支付博弈的联盟C-安全性条件, 从而给出了保证不连续向量支付博弈α-核存在的两类充分条件, 进一步利用广义Hadmard良定性的引理, 证明了一类不连续向量支付博弈α-核的良定性。