基本信息

刘康  男  博导  中国科学院自动化研究所

模式识别国家重点实验室
电子邮件: kliu AT nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号
邮政编码: 100190


个人主页:http://www.nlpr.ia.ac.cn/cip/~liukang/index.html

个人介绍:刘康,中国科学院自动化研究所模式识别国家重点实验室研究员、博士生导师,中国科学院大学岗位教授,北京智源人工智能研究院青年科学家。研究领域包括自然语言处理、文本信息抽取、知识图谱、问答系统等。目前承担科技创新2030—新一代人工智能重大项目课题、中国科学院先导等多项国家重大项目。目前在自然语言处理、知识工程等领域国际重要会议和期刊发表多篇学术论文,Google Scholar引用20000余次,单篇引用数达到3000余次,H-Index为5620222023年连续入选美国斯坦福大学发布的全球前2%顶尖科学家榜单。连续五年(2020-2023)入选Aminer "AI 2000 Most Influential Scholar Honorable Mention in AI/NLP"6篇论文入选PaperDigest 20239月发布的AAAI2篇)、ACL1篇)、EMNLP2篇)、CIKM1篇)最有影响力论文榜单(各会议每年15篇)。近五年在CSRankings自然语言处理领域中国科学院该领域内研究者中排名第一,7次获得自然语言处理与知识工程领域旗舰会议最佳论文奖,如ISWC-2023(CCF B)最佳Poster&Demo奖、COLING-2014(CCF B)最佳论文奖等。曾获2019北京市科学技术进步一等奖(第二完成人)、2018中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(第二完成人);2022国家电网有限公司科学进步二等奖等。也多次获得个人学术奖励,包括:2019年获得国家自然科学基金委优秀青年基金,2019年入选北京智源人工智能研究院青年科学家,2020年入选中国科学院青年促进会优秀会员等,2015和2016年连续获得Google Focused Research Award,2014年获得中国中文信息学会“汉王青年创新一等奖”等多项学术奖励。兼任中国中文信息学会理事、中国中文信息学会计算语言学专委会、中国中文信息学会语言与知识计算专委会秘书长等学术职务。目前担任Pattern Recognition、TACL等学术期刊编委,也曾任ACL、AAAI、EMNLP、CIKM、ISWC、EACL等国际高水平学术会议(Senior)Area Chair/Senior PC member。

研究方向

自然语言处理、知识图谱、大语言模型、可解释方法、神经符号学习

  1. 基于大模型的知识学习与获取:实体抽取、事件抽取、常识知识学习、知识连续学习

  2. 基于大小模型协同的知识利用:知识增强的大语言模型、知识Agent、基于大语言模型的表格理解与应用

  3. 基于大语言模型的知识机理分析与评估:大语言模型知识定位与探测、大语言模型知识学习机理分析、神经网络的可解释方法

  4. 知识推理:基于思维链增强的知识推理、基于大语言模型的知识归纳与推理

招生信息

每年招收1-2名全日制博士/硕士生,常年招收实习生,欢迎致力于从事自然语言处理、知识工程研究方向的同学,特别是对于科研怀揣的极高的热情、崇高的理想的同学加盟,我们将为你提供一流的科研环境、温馨的工作氛围,让我们一起努力、奋斗。


招生专业
081203-计算机应用技术
081104-模式识别与智能系统
招生方向
自然语言处理,信息抽取,知识图谱,问答系统,信息检索
机器学习,深度学习

教育背景

2006-09--2010-07   中国科学院自动化研究所   博士
2002-09--2005-04   西安电子科技大学   硕士
1998-09--2002-07   西安电子科技大学   学士

工作经历


工作简历
2019-11~现在, 中国科学院自动化研究所, 研究员
2014-11~2019-10,中国科学院自动化研究所, 副研究员
2010-07~2014-10,中国科学院自动化研究所, 助理研究员
社会兼职
2022-10-28-今,中国中文信息学会计算语言学专委会副主任, 副主任
2021-12-31-今,中国中文信息学会理事, 理事
2021-02-02-今,Pattern Recognition, Associate Editor
2019-08-30-今,北京智源人工智能研究院青年科学家, 青年科学家
2018-05-04-2020-10-26,中国中文信息学会青年工作委员会, 主任
2017-08-31-今,中国中文信息学会语言与知识计算专委会, 秘书长

教授课程

信息检索
知识图谱与语义计算
知识图谱导论
深度学习下的自然语言处理:理论与实践

学术奖励与专利

学术获奖
(1) 中国科学院青年促进会优秀会员, 特等奖, 院级, 2020
(2) 北京市科学技术进步奖, 一等奖, 省级, 2019
(3) 钱伟长中文信息处理科学技术奖, 一等奖, 部委级, 2018
(4) Google Focused Research Award, 其他, 2016
(5) Google Focused Research Award, , 其他, 2015
(6) 钱伟长中文信息处理科学技术奖-汉王青年创新奖, 一等奖, 其他, 2014
(7) COLING 2014 Best Paper Award, 特等奖, 其他, 2014
(8) 首届“CCF-腾讯犀牛鸟”基金卓越奖, 特等奖, 其他, 2014
专利成果
( 1 ) 知识图谱上的树状规则提取方法及装置, 发明专利, 2023, 第 1 作者, 专利号: CN116578714A

( 2 ) 使用大型语言模型进行医疗问答的方法及系统, 发明专利, 2023, 第 3 作者, 专利号: CN116595131A

( 3 ) 文本答案的推理方法、装置及存储介质, 发明专利, 2023, 第 3 作者, 专利号: CN116521834A

( 4 ) 示意图问答方法及系统, 发明专利, 2023, 第 3 作者, 专利号: CN116431777A

( 5 ) 文本事件序列生成方法、装置、设备和存储介质, 发明专利, 2023, 第 1 作者, 专利号: CN115618863A

( 6 ) 基于开放式规则的前提关系生成方法、装置和电子设备, 发明专利, 2023, 第 1 作者, 专利号: CN115687613A

( 7 ) 知识问答方法、装置、电子设备和可读存储介质, 发明专利, 2023, 第 2 作者, 专利号: CN115618011A

( 8 ) 篇章级关系抽取方法、装置、电子设备及存储介质, 发明专利, 2023, 第 1 作者, 专利号: CN115618846A

( 9 ) 归因解释方法的稳定性的确定方法、装置和设备, 发明专利, 2022, 第 2 作者, 专利号: CN115422921A

( 10 ) 归因解释方法的稳定性的确定方法、装置和设备, 发明专利, 2022, 第 2 作者, 专利号: 202211066401.8

( 11 ) 解释指导的知识蒸馏方法、装置、电子设备及存储介质, 发明专利, 2022, 第 1 作者, 专利号: CN115481740A

( 12 ) 算术表达式的生成方法、装置、设备、介质及产品, 发明专利, 2022, 第 1 作者, 专利号: 202210754115.4

( 13 ) 算术表达式的生成方法、装置、设备、介质及产品, 发明专利, 2022, 第 1 作者, 专利号: CN115309858A

( 14 ) 语义解析结果重排序方法及系统, 发明专利, 2022, 第 2 作者, 专利号: CN115238705A

( 15 ) 语义解析结果重排序方法及系统, 发明专利, 2022, 第 2 作者, 专利号: 202210731235.2

( 16 ) 目标答案获取方法、装置、电子设备及存储介质, 发明专利, 2022, 第 3 作者, 专利号: CN115238031A

( 17 ) 目标答案获取方法、装置、电子设备及存储介质, 发明专利, 2022, 第 3 作者, 专利号: 202210719711.9

( 18 ) 知识图谱的推理方法及装置, 发明专利, 2022, 第 2 作者, 专利号: CN115222050A

( 19 ) 知识图谱的推理方法及装置, 发明专利, 2022, 第 2 作者, 专利号: 202210574007.9

( 20 ) 对齐增强语义解析方法、装置和计算机程序产品, 发明专利, 2022, 第 2 作者, 专利号: CN115062603A

( 21 ) 对齐增强语义解析方法、装置和计算机程序产品, 发明专利, 2022, 第 2 作者, 专利号: 202210557374.8

( 22 ) 知识结构持续扩展方法、装置、设备和介质, 发明专利, 2022, 第 3 作者, 专利号: CN114925164A

( 23 ) 知识结构持续扩展方法、装置、设备和介质, 发明专利, 2022, 第 3 作者, 专利号: 202210476432.4

( 24 ) 事件因果关系识别方法、装置、电子设备与存储介质, 2023, 第 2 作者, 专利号: CN113779190B

( 25 ) 基于联邦学习的分布式语言关系识别方法、系统和装置, 专利授权, 2021, 第 3 作者, 专利号: CN112101578B

( 26 ) 基于知识巩固的增量事件识别方法、系统、装置, 专利授权, 2021, 第 3 作者, 专利号: CN112101484B

( 27 ) 基于屏蔽泛化机制的事件因果关系识别方法、系统、装置, 发明专利, 2021, 第 2 作者, 专利号: CN111881688B

( 28 ) 基于人工智能的文本处理方法、装置及电子设备, 发明专利, 2020, 第 2 作者, 专利号: CN111858898A

( 29 ) 基于信息增强的对话状态跟踪方法、系统、装置, 发明专利, 2020, 第 3 作者, 专利号: CN111061850A

( 30 ) 基于给定事实的问句生成方法及系统, 2023, 第 1 作者, 专利号: CN111061851B

( 31 ) 基于图网络融入词典的中文命名实体识别方法, 发明专利, 2020, 第 3 作者, 专利号: CN111046671A

( 32 ) 基于给定事实的问句生成方法及系统, 发明专利, 2020, 第 1 作者, 专利号: CN111061851A

( 33 ) 基于外部知识增强的机器阅读理解方法、系统、装置, 2023, 第 1 作者, 专利号: CN111078836B

( 34 ) 基于外部知识增强的机器阅读理解方法、系统、装置, 发明专利, 2020, 第 1 作者, 专利号: CN111078836A

( 35 ) 基于图网络的答案句选择方法及装置, 发明专利, 2021, 第 3 作者, 专利号: CN110941962B

( 36 ) 跨语言事件分类方法及装置, 发明专利, 2020, 第 1 作者, 专利号: CN110941955A

( 37 ) 基于人工智能的回复消息生成方法、装置、服务器及介质, 2022, 第 2 作者, 专利号: CN110442693B

( 38 ) 基于人工智能的回复消息生成方法、装置、服务器及介质, 发明专利, 2019, 第 2 作者, 专利号: CN110442693A

( 39 ) 基于对抗模仿学习的事件识别及分类方法、系统、装置, 发明专利, 2019, 第 2 作者, 专利号: CN110209816A

( 40 ) 基于自注意力机制的中文命名实体识别方法及装置, 发明专利, 2019, 第 2 作者, 专利号: CN109783812A

( 41 ) 基于自注意力机制的中文命名实体识别方法、系统、装置, 专利授权, 2020, 第 2 作者, 专利号: CN109783812B

( 42 ) 基于强化学习的关系抽取方法和装置, 发明专利, 2018, 第 2 作者, 专利号: CN108280058A

( 43 ) 基于多语注意力机制的事件识别及分类方法及装置, 专利授权, 2018, 第 2 作者, 专利号: CN108345583A

( 44 ) Method and device for parsing question in knowledge base, 发明专利, 2020, 第 2 作者, 专利号: US10706084(B2)

( 45 ) 创建用于自然语言处理装置的训练数据的方法和设备, 发明专利, 2018, 第 3 作者, 专利号: CN107688583A

( 46 ) 基于概率软逻辑PSL的事件识别方法和系统, 发明专利, 2015, 第 1 作者, 专利号: CN104881399A

( 47 ) 基于多知识库和整数线性规划ILP的自动问答方法和系统, 专利授权, 2015, 第 1 作者, 专利号: CN104820694A

( 48 ) 一种本体对齐方法及装置, 专利授权, 2016, 第 1 作者, 专利号: CN106156082A

( 49 ) 一种基于循环卷积网络的文本分类方法, 发明专利, 2015, 第 2 作者, 专利号: CN104572892A

( 50 ) 知识库中问句解析的方法及设备, 专利授权, 2016, 第 2 作者, 专利号: CN105528349A

( 51 ) 一种借助图随机游走的开放类别命名实体抽取方法及装置, 发明专利, 2014, 第 1 作者, 专利号: CN103678703A

论文与评测获奖

论文获奖:
  1. 第二十五届国际计算语言学会议(COLING 2014)最佳论文奖

  2. 国际语义网大会(ISWC 2024)最佳张贴论文奖(Best Poster&Demo)

  3. The Fourth International Symposium on Natural Language Processing Based on Naturally Annotated Big Data (NLP-NABD 2016)最佳论文奖 

  4. 全国知识图谱与语义计算大会(CCKS-2017)最佳论文奖

  5. 全国知识图谱与语义计算大会(CCKS-2019)最佳论文奖

  6. 第十八届全国计算语言学会议(CCL-2019)最佳论文奖

  7. 全国知识图谱与语义计算大会(CCKS-2020)英文最佳论文奖和中文最佳论文提名奖

  8. 第十九届中国计算语言学大会(CCL-2020)最佳论文奖

评测获奖:

  1. KDD CUP 2011 Track2知识推荐全球亚军

  2. 2014CLEF知识库自动评测第一名

  3. NAACL-2021-SMM4H医疗文本知识抽取-自报告病人检测赛道冠军

  4. 2021未来杯高校AI学术联赛全国总冠军“融合知识图谱的多模态智能医疗对话系统”(

  5. 全国知识图谱与语义计算大会(CCKS-2021)“医疗科普知识答非所问识别”赛道评测任务冠军

  6. Aminer学者画像评测比赛季军

  7. AAAI-2022“缩写词抽取与消歧”评测任务冠军

  8. 国际评测SemEval-2022-中文复杂和歧义命名实体识别赛道亚军

科研活动

   
科研项目
( 1 ) 知识关联与推理类问题求解关键技术及系统, 负责人, 国家任务, 2015-01--2018-06
( 2 ) Representing and Reasoning Knowledge by Jointly Learning on Knowledge Graphs, Textual Triples and Unstructured Texts, 负责人, 企业委托, 2015-10--2016-10
( 3 ) 基于大规模知识图谱的文本语义分析、知识图谱补全与验证, 负责人, 企业委托, 2015-06--2016-06
( 4 ) 跨语言QA系统的研究开发, 负责人, 企业委托, 2015-06--2015-12
( 5 ) 互联网环境下中文实体知识挖掘关键技术研究, 负责人, 国家任务, 2013-01--2015-12
( 6 ) 面向问答场景意图识别系统的语义相似度计算, 负责人, 企业委托, 2017-06--2018-12
( 7 ) 面向客服聊天记录质检的问答对齐研究, 负责人, 企业委托, 2018-08--2020-08
( 8 ) 面向智能客服的自然问答关键技术研究, 负责人, 研究所自选, 2018-05--2019-12
( 9 ) Cross-lingual Text and Knowledge Graph Jointly Embeddings, 负责人, 企业委托, 2016-12--2020-06
( 10 ) 青促会专项, 负责人, 研究所自选, 2016-01--2020-06
( 11 ) 面向开放领域的关系抽取技术研究, 负责人, 其他任务, 2016-07--2018-01
( 12 ) 产品知识库构建关键技术研究, 负责人, 国家任务, 2016-01--2019-06
( 13 ) 面向生活垂直领域的精准问答关键技术研究, 负责人, 企业委托, 2013-10--2015-04
( 14 ) 面向大规模开放域知识库的深度问答关键技术研究, 负责人, 企业委托, 2015-10--2017-06
( 15 ) 面向案件审判执行全流程的智能问答技术及平台, 负责人, 国家任务, 2018-08--2021-07
( 16 ) 知识关联与事件推理类问题求解关键技术与系统, 负责人, 国家任务, 2019-04--2022-04
( 17 ) 信息抽取与问答系统, 负责人, 国家任务, 2020-01--2022-12
( 18 ) 面向抑郁症智能诊疗的可解释对话系统研究, 负责人, 中国科学院计划, 2020-01--2022-12
( 19 ) 事件图谱构建与应用关键技术, 负责人, 企业委托, 2020-03--2021-03
( 20 ) 基于图机器学习的电力运检领域知识发现与推理决策关键技术研究及应用, 负责人, 企业委托, 2020-09--2023-09
( 21 ) 现代配电网运行分析及保护控制关键技术, 负责人, 地方任务, 2022-01--2024-12
( 22 ) 南亚东南亚语言机器翻译能力支撑凭条关键技术研发及产业应用, 负责人, 地方任务, 2021-01--2023-12
( 23 ) 中国科学院青年创新促进会会优秀会员, 负责人, 中国科学院计划, 2021-01--2023-12
( 24 ) 基于神经符号学习的大规模知识获取与深度问答关键技术研究(北京智源青年科学家项目), 负责人, 其他任务, 2019-10--2020-09
( 25 ) 基于神经符号学习的大规模知识获取与推理关键技术研究(北京智源青年科学家项目), 负责人, 其他任务, 2020-10--2021-09
( 26 ) 中科院先导A项目课题, 负责人, 中国科学院计划, 2020-07--2025-06
( 27 ) 智能电话机器人场景迁移关键技术研发, 负责人, 企业委托, 2020-08--2021-07
( 28 ) 面向智能客服的自然问答关键技术研究, 负责人, 研究所自选, 2021-01--2022-12
( 29 ) 跨模态暗知识可解释分析与转换, 负责人, 国家任务, 2023-01--2025-12

指导学生

已指导学生

周波  硕士研究生  081104-模式识别与智能系统  

李泽政  硕士研究生  081203-计算机应用技术  

宋挺  硕士研究生  085211-计算机技术  

郭展成  硕士研究生  085211-计算机技术  

兰胤余  硕士研究生  085211-计算机技术  

朱冲  硕士研究生  085211-计算机技术  

现指导学生

许豹  硕士研究生  085400-电子信息  

孙望涛  硕士研究生  081104-模式识别与智能系统  

杨朝  博士研究生  081203-计算机应用技术  

江忠涛  博士研究生  081104-模式识别与智能系统  

孙园成  博士研究生  081104-模式识别与智能系统  

卫一帆  硕士研究生  085410-人工智能  

贾文雷  硕士研究生  085410-人工智能  

雷方雨  博士研究生  081203-计算机应用技术  

宋瀚林  博士研究生  081203-计算机应用技术  

韩旭  博士研究生  081104-模式识别与智能系统  

袁晓薇  博士研究生  081203-计算机应用技术  

孙润鑫  博士研究生  081104-模式识别与智能系统  

张豪  博士研究生  081104-模式识别与智能系统  

任勇  博士研究生  081104-模式识别与智能系统  

毕业生去向

周波   硕士研究生  自动化所继续读博

李泽政  硕士研究生  百度

宋挺  硕士研究生  美团

郭展成  硕士研究生  搜狗

朱冲 硕士研究生  华为

兰胤余  硕士研究生  东南大学读博

孙润鑫 硕士研究生 百度

杨朝 博士研究生 美团

江忠涛 博士研究生 快手

协助指导学生

齐振宇  博士研究生  081104-模式识别与智能系统  自动化所留所工作

张涛  博士研究生  081104-模式识别与智能系统  快手

刘洋  博士研究生  081203-计算机应用技术  阿里

徐立恒  博士研究生  081203-计算机应用技术  创业

曾道建  博士研究生  081104-模式识别与智能系统  湖南师范大学

何世柱  博士研究生  081104-模式识别与智能系统  自动化所留所工作

来斯惟  博士研究生  081104-模式识别与智能系统  火花思维

陈玉博  博士研究生  081104-模式识别与智能系统  自动化所留所工作

张元哲  博士研究生  081104-模式识别与智能系统  自动化所留所工作

王雪鹏  博士研究生  081104-模式识别与智能系统  腾讯

郝彦超  博士研究生  081104-模式识别与智能系统  腾讯

纪国良  博士研究生  081104-模式识别与智能系统  三峡集团

魏琢钰  博士研究生  081203-计算机应用技术  微软

刘树林  博士研究生  081104-模式识别与智能系统  腾讯

王炳宁  博士研究生  081203-计算机应用技术  搜狗

曾祥荣  博士研究生  081104-模式识别与智能系统  快手

刘操  博士研究生  081203-计算机应用技术  美团

田志兴  博士研究生  081203-计算机应用技术  京东

左新宇  博士研究生  081203-计算机应用技术  腾讯

刘健  博士研究生  081104-模式识别与智能系统  北方交通大学

刘庆斌  博士研究生  081203-计算机应用技术  腾讯

隋典伯  博士研究生  081104-模式识别与智能系统  哈尔滨工业大学(威海)

曹鹏飞  博士研究生  081104-模式识别与智能系统  中国科学院自动化研究所




论文发表

在自然语言处理、知识工程等领域高水平国际学术会议(如:TKDE、ACL、EMNLP、COLING、AAAI、IJCAII等)发表学术论文80余篇。Google Scholar引用量20000余次,单篇引用3000余次,H-Index为56。


专著与译著:

  1. 《知识图谱》(ISBN:9787040509847,高教出版社出版,第二作者,该书是国内关于知识图谱的第一本系统性学术著作)

  2. 《知识图谱:算法与实践》(ISBN: 9787040577259,高教出版社,第二作者,2022年出版)

  3. 《情感分析:挖掘观点、情感和情绪》(ISBN:9787111574989,机械工业出版社出版社,第一译者)


近期发表论文:

     参考Google Scholar:‪‬https://scholar.google.com/citations?user=DtZCfl0AAAAJ&hl=en