李凯
中国科学院自动化研究所
复杂系统认知与决策实验室
高效智能计算与学习团队
电子邮件:kai.li@ia.ac.cn
通信地址:北京市海淀区中关村东路95号自动化大厦1123室
邮政编码:100190
个人介绍
李凯,中国科学院自动化研究所副研究员,硕士生导师,研究领域为强化学习、大模型、AI4Science等,负责国家自然科学基金、中国科学院战略性先导科技专项课题、新一代人工智能国家科技重大专项子课题等多项重要科研任务,同时获CCF-腾讯犀牛鸟基金、CCF-百度松果基金等知名校企合作项目支持,在包括CCF-A类期刊会议(如Artificial Intelligence、NeurIPS、ICML、ICLR、AAAI、IJCAI等)上发表学术论文40余篇,长期担任NeurIPS、ICLR等AI顶级会议领域主席(Area Chair),获CCF-A类会议AAAI 2022卓越论文奖,获2020 CCF-腾讯犀牛鸟科研基金优秀奖,申请/授权国家发明专利20余项,获多次国际竞赛冠军。
招生信息
招收对强化学习、大模型、AI4Science等方向感兴趣的研究生。希望你具备良好的数学、编程和英语基础,踏实肯干的精神和乐观积极的心态。
对学生的培养侧重基础学术研究,团队算力资源充沛,鼓励学生自主开展前沿的研究课题,发表高水平国际学术论文。
本人与国内头部企业如腾讯AI Lab等一直保持密切合作,鼓励学生开展实习交流。
欢迎计算机等相关专业的学生联系报考,由于招生数量有限,请提前与我联系。
长期招收科研实习生(本科生、硕博生等),参与国家级项目,发表高水平论文,可推荐读研、读博、工作。
培养方式与理念:充分尊重学生的研究兴趣。在每位学生的前两篇论文中,都会提供全程、细致的科研指导,涵盖从研究构思、论文撰写到投稿的各个环节。同时,注重循序渐进地培养学生的独立科研能力。定期与学生共同阅读论文、讨论研究思路,并认真研读学生感兴趣的每一篇论文,以确保能够持续给予高质量的指导。
教育背景
工作经历
2018-07--2019-12,中国科学院自动化研究所, 助理研究员
教授课程
发表论文
近期以第一/通讯作者发表的代表性论文如下:
Deep (Predictive) Discounted Counterfactual Regret Minimization. Hang Xu, Kai Li, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. AAAI Conference on Artificial Intelligence (AAAI), 2026, Oral. (Corresponding Author)
Offline Opponent Modeling with Truncated Q-driven Instant Policy Refinement. Yuheng Jing, Kai Li, Bingyun Liu, Ziwen Zhang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. International Conference on Machine Learning (ICML), 2025. (Corresponding Author)
Goal-Oriented Skill Abstraction for Offline Multi-Task Reinforcement Learning Jinmin He, Kai Li, Yifan Zang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. International Conference on Machine Learning (ICML), 2025. (Corresponding Author)
An Open-Ended Learning Framework for Opponent Modeling. Yuheng Jing, Kai Li, Bingyun Liu, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. AAAI Conference on Artificial Intelligence (AAAI), 2025, Oral, Top 5%. (Corresponding Author)
Automatically Designing Counterfactual Regret Minimization Algorithms for Solving Imperfect-Information Games. Kai Li, Hang Xu, Haobo Fu, Qiang Fu, Junliang Xing. Artificial Intelligence (AI), 2024.
Efficient Multi-task Reinforcement Learning with Cross-Task Policy Guidance. Jinmin He, Kai Li, Yifan Zang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. Neural Information Processing Systems (NeurIPS), 2024. (Corresponding Author)
Opponent Modeling with In-context Search. Yuheng Jing, Bingyun Liu, Kai Li, Yifan Zang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. Neural Information Processing Systems (NeurIPS), 2024. (Corresponding Author)
Minimizing Weighted Counterfactual Regret with Optimistic Online Mirror Descent. Hang Xu, Kai Li, Bingyun Liu, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. International Joint Conference on Artificial Intelligence (IJCAI), 2024. (Corresponding Author)
Towards Offline Opponent Modeling with In-context Learning. Yuheng Jing, Kai Li, Bingyun Liu, Yifan Zang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. International Conference on Learning Representations (ICLR), 2024. (Corresponding Author)
Dynamic Discounted Counterfactual Regret Minimization. Hang Xu, Kai Li, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. International Conference on Learning Representations (ICLR), 2024, Spotlight, Top 5%. (Corresponding Author)
Not All Tasks Are Equally Difficult: Multi-Task Deep Reinforcement Learning with Dynamic Depth Routing. Jinmin He, Kai Li, Yifan Zang, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. AAAI Conference on Artificial Intelligence (AAAI), 2024. (Corresponding Author)
Automatic Grouping for Efficient Cooperative Multi-Agent Reinforcement Learning. Yifan Zang, Jinmin He, Kai Li, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng. Neural Information Processing Systems (NeurIPS), 2023. (Corresponding Author)
OpenHoldem: A Benchmark for Large-Scale Imperfect-Information Game Research. Kai Li, Hang Xu, Enmin Zhao, Zhe Wu, Junliang Xing. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023.
- ...
科研项目
超常环境下复杂系统的智能计算,新一代人工智能国家科技重大专项,子课题负责人,2025.06~2030.05
科学基础大模型关键技术,中国科学院A类先导科技专项,课题负责人,2024.11~2026.10
自主进化智能,中国科学院A类先导科技专项,子课题负责人,2020.07~2025.06
博弈智能对抗演练场基础理论与平台,新一代人工智能国家科技重大专项,子课题负责人,2023.01~2025.12
对抗推演关键技术及系统研发,科技创新2030“新一代人工智能”重大项目,核心骨干,2020.07~2023.06
指导学生
指导学生
张紫闻,硕士研究生
顾胜达,硕士研究生
戴士哲,硕士研究生
支凌宇,硕士研究生
联合指导学生
赵恩民,博士研究生
康永欣,博士研究生
臧一凡,博士研究生
徐航,博士研究生
何金岷,博士研究生
景煜恒,博士研究生
武希举,博士研究生
王润翔,博士研究生
王博霄,博士研究生
陈芝玮,博士研究生
尹鹏,博士研究生