博弈学习理论 目录
第1章 引论1.1 前言1.2 大群体模型和匹配模型1.3 三个常用的学习和/或进化模型1.4 库诺特调整1.5 库诺特动态分析1.6 具有锁定功能的库诺特过程1.7 回顾同时行动有限博弈附录:动态系统和局部稳定性参考文献第2章 虚拟行动2.1 引言2.2 两人虚拟行动2.3 虚拟行动中的渐近行动2.4 对虚拟行动中循环的解释2.5 多人虚拟行动2.6 虚拟行动的支付2.7 两战略博弈中的一致性和相关均衡2.8 虚拟行动和*优反应动态2.9 虚拟行动的一般化附录:狄利克雷先验和多项抽样参考文献第3章 模仿者动态和相关的确定性进化模型3.1 引言3.2 同质群体中的模仿者动态3.3 同质群体模仿者动态的稳定性3.4 进化稳定战略3.5 非对称模仿者动态模型3.6 对模仿者动态方程的解释3.7 模仿者动态的一般化和重复剔除严格劣战略3.8 短视调整动态3.9 集值极限点和漂移3.10 廉价磋商和秘密握手3.11 离散时间模仿者系统附录:刘维尔(Liouville)定理参考文献第4章 随机虚拟行动和混合战略均衡4.1 引言4.2 收敛的概念4.3 渐近短视和渐近经验主义4.4 随机扰动支付与平滑*优反应4.5 平滑虚拟行动和随机逼近4.6 部分抽样4.7 普遍一致性和平滑虚拟行动4.8 刺激反应和作为学习模型的虚拟行动4.9 对战略空间的学习附录:随机逼近理论参考文献第5章 具有持续随机性的调整模型5.1 引言5.2 回顾随机调整模型5.3 坎多里迈拉斯罗布(Kandori Mailath Rob)模型5.4 讨论其他动态5.5 局部相互作用5.6 吸引域的半径和协半径5.7 修正的协半径5.8 具有异质群体的一致随机匹配5.9 随机模仿者动态附录A:有限马尔可夫链的回顾附录B:随机稳定分析参考文献第6章 扩展式博弈和自确认均衡6.1 引言6.2 一个例子6.3 扩展式博弈6.4 一个简单的学习模型6.5 自确认均衡的稳定性6.6 异质的自确认均衡6.7 一致自确认均衡6.8 一致自确认均衡与纳什均衡6.9 可理性化的自确认均衡和关于对手支付的先验信息参考文献第7章 纳什均衡,大群体模型和扩展式博弈中的变异7.1 引言7.2 相关信息集和纳什均衡7.3 外生试验7.4 在被比做吃角子老虎机问题的博弈中的学习7.5 定态学习7.6 “快速学习”模型中的随机调整和后向归纳7.7 廉价磋商博弈中的变异和快速学习7.8 试验和期限的长度附录:吃角子老虎机问题回顾参考文献第8章 老练学习8.1 引言8.2 条件学习的三个范例8.3 老练学习的贝叶斯方法8.4 绝对连续条件的解释8.5 选择专家8.6 条件学习8.7 折现8.8 分类策略和循环8.9 内省的分类规则,校准和相关均衡8.10 模式识别中的索斯诺模型8.11 操纵学习程序参考文献索引
博弈学习理论 节选
在经济学中,绝大多数的非合作博弈理论集中研究博弈中的均衡问题,尤其是纳什均衡及其精炼。对均衡什么时候出现以及为什么均衡会出现,传统解释是,均衡是在博弈的规则、参与人的理性以及参与人的支付函数都是共同知识的情况下,由参与人的分析和自省所得出的结果。不论是在概念上还是在实证上,这个理论都存在许多问题。在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随时间的推移寻求*优化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
博弈学习理论 作者简介
朱·弗登伯格(Drew Fudenberg),哈佛大学经济系教授。1981年毕业于麻省理工学院,获得经济学博士学位。主要研究领域为博弈论和动态经济学。曾在加州大学伯克利分校、麻省理工学院、斯坦福大学和法国图卢兹大学任教。1 982年至今,朱·弗登伯格教授一直是美国国家科学基金的主要负责人,1998年以来为美国计量经济学会委员会委员。他与让·梯若尔教授合著的《博弈论》是全球范围内最流行的博弈论教材。
戴维·K·莱文(David K.Levme),华盛顿大学圣路易斯分校经济学教授,他的研究工作包括研究知识产权和内生增长的动态一般均衡模型,偏好的内生形成,社会规范和机构,博弈学习理论和实验经济学中的博弈理论应用。