讲座:强化学习与数学规划算法融合创新与应用 发布时间:2026-05-20
- 活动时间:
- 活动地址:
- 主讲人:
题 目:强化学习与数学规划算法融合创新与应用
嘉 宾:镇璐 教授 上海大学管理学院
主持人:曾智宇 助理教授 上海交通大学安泰经济与管理学院
时 间:2026年5月27日(周三)14:00-15:30
地 点:安泰楼A507室
内容简介:
机器学习(ML)与数学规划内嵌融合是当前运筹学(OR)领域热点研究方向之一。本报告主要介绍如何将机器学习中一些强化学习技术与常用的数学规划算法融合,形成新的嵌套算法,进而应用于一些复杂管理决策问题或经典优化问题。在现实的管理优化应用领域中,大多数决策问题都会被建模为整数规划或混合整数规划问题。针对大规模混合整数规划模型的求解,列生成算法和Benders分解算法是最常见的两类数学规划算法。本报告主要介绍上述两种常见的数学规划算法和强化学习技术融合的不同模式:一类在列生成算法中内嵌强化学习(近端策略优化PPO),一类在强化学习(PPO和生成对抗网络GAN)中内嵌Benders 分解,形成两类新的“ML-OR融合算法”,进而分别应用于一个前沿问题和一个经典问题(电动车换电站网络规划、考虑服务时间的Close-Enough TSP)。本报告将介绍上述具体的强化学习技术与列生成算法或Benders分解算法内嵌融合的核心思路、在具体优化问题应用中的算法设计细节、算法与建模创新点、以及实验结果展示。
演讲人简介:
镇璐,上海大学管理学院院长、二级教授、博导,校经管学科学位评定分委员会主席、国务院政府特殊津贴专家。1999年至2008年就读于上海交通大学,先后于2003年、2008年获学士、博士学位。博士毕业后,赴新加坡国立大学从事了两年多的博士后研究,2011年3月起任职于上海大学管理学院,担任讲师,先后于2011年10月、2012年11月破格晋升为副教授、教授,2019年11月担任管理学院院长。近年来在:管理科学学报、OR、TS、POM、IISE等国内外知名学术期刊发表论文284篇(其中,一作或通讯 250篇);根据谷歌学术统计,论文被引用10481次,H-index为 55。先后主持国家自科青C(2011)、青B(2014)、面上(2016)、重点(2018)、青A(2020)、国合(2022)、重大课题(2023)等7项国家级项目;结项项目绩效评估均为“优”或“特优”。研究成果曾以“独立完成人”荣获:教育部自然科学二等奖、上海市自然科学二等奖、教育部人文社科二等奖、上海市哲社优秀成果一等奖;以“第一完成人”荣获:教育部第九届人文社科三等奖、上海市哲社优秀成果二等奖。受邀担任国际A档期刊《Transportation Science》、《Transportation Research Part B》、国际B档期刊《Computers & Operations Research》、《Journal of the Operational Research Society》等SCI/SSCI国际期刊的副编辑和编委等。
欢迎广大师生参加!


