12月29日下午,交通与车辆工程学院邀请南京理工大学电子工程与光电技术学院教授张伟斌作学术报告,报告会采用线上的方式进行。学院副院长李波、教师代表、硕士研究生参加会议。报告会由李波主持。
张伟斌以“基于强化学习的干线信号控制”为题,从强化学习、深度强化学习、多智能体强化学习、基于多智能体强化学习干线信号协调控制等四个方面作学术报告。他深入阐释了强化学习和深度强化学习的内涵和概念,通过马尔科夫决策过程提出基于模型的强化学习算法的优势在于智能体能够提前考虑来进行规划,并对策略方法的发展、问题描述、及算法介绍、MDP设置和神经网络结构进行详细介绍。
报告第二阶段,张伟斌教授作国家自然科学基金申报指导报告,他结合自己申报基金的经验和体会,从研究意义、内容、目标、关键问题、以及研究方案和研究基础等方面分享了心得体会。
讨论互动环节,张伟斌教授和与会师生就深度强化学习、国家基金报告撰写等问题展开热烈讨论,与大家分享自己的见解和经验。
张伟斌,南京理工大学电子工程与光电技术学院,教授,博导。无线通信与传感网研究所副所长,江苏省智能交通信息感知与数据分析工程实验室副主任。研究经历包括:芬兰阿尔托大学博士后,研究方向为航运安全;美国华盛顿大学博士后研究员,研究方向为智能交通系统与交通大数据。中国交通运输协会新技术分会理事,江苏省系统工程学会理事。主持国家自然科学基金、国家重点研发计划子课题等项目20余项,发表学术论文100余篇,申请和授权发明专利30余项,合作出版专著和教材2部,获省部级奖励6项。指导研究生获江苏省优秀硕士论文1篇。
撰稿:杨佳欣
摄影:杨佳欣
编辑:杨佳欣
指导老师:张杨