当前位置: 首 页 - 科学研究 - 学术报告 - 正文

bat365在线平台、所2023年系列学术活动(第053场):郭尚岐 助理研究员 清华大学精密仪器系

发表于: 2023-05-17   点击: 

报告题目: 基于因果推理的强化学习算法

报 告 人: 郭尚岐 清华大学精密仪器系助理研究员

所在单位:清华大学精密仪器系

报告时间:2023年5月22日 星期一 10:00-11:00

报告地点:数学楼第二报告厅

校内联系人:孙维鹏 sunwp@jlu.edu.cn


报告摘要:在面对实际复杂问题时,强化学习通常面临部分观测的问题。为此,目前研究通常将历史观测序列引入到强化学习算法中,然而这导致状态空间随着历史长度增加而指数级增大。因果学习可以挖掘历史观测中的重要观测状态,讲历史序列进行压缩,从而降低历史观测空间的复杂度,提高基于历史观测的强化学习算法的效率。


报告人简介:

2011年9月-2015年6月,电子科技大学数理基础科学班,本科

2015年9月-2021年6月,清华大学自动化系,博士;

2021年12月至今,清华大学精密仪器系,博士后;