2022年10月16日上午,山东大学陈增敬教授应邀在腾讯会议(ID: 784-824-052)开展了一场题为“Nonlinear expectations and its applications in reinforcement learning and two-armed bandit problem”的学术讲座。本场讲座采用线上的方式,统计和数学学院部分老师和研究生参加了此次讲座。
陈增敬教授任职于山东大学。主要研究方向包括金融数学,倒向随机微分方程,计量经济学等。陈增敬教授是国家高层次人才、第十四届孙冶方经济科学奖获得者,作为独立完成人完成的项目“资产定价理论中的非线性期望方法”荣获2015年度国家自然科学二等奖,与美国艺术与科学院士、著名经济学家Epstein合作发表在国际顶级经济刊 Econometrica上的论文是大陆学者第一篇发表在该顶级期刊的论文。得到了被称为Chen-Epstein的资产定价公式,被诺贝尔经济奖获得者 Sargent和Hansen等国际著名专家引用或推广。
本次讲座主要介绍了“非线性期望在强化学习和多臂老虎机问题中的应用”。讲座中介绍了强化学习以及老虎机问题的模型和方法,而且考虑了几个关于老虎机问题的策略极限定理,主要包括策略大数定律、策略大偏差原理和策略中心极限定理。
本次讲座持续一个多小时,陈增敬教授利用简单、直白的话语阐述一些难懂的概念,使同学们受益颇深。本次讲座内容丰富,对在场的师生具有极大的启发,开阔了老师和同学们的知识面和视野。最后,部分老师与陈教授进行讨论与交流,本场讲座在全场热烈的掌声中圆满结束。
上一条: 没有了 |
下一条: 没有了 |