谢旭荣  男  副研究员 中国科学院软件研究所 人机交互技术与智能信息处理实验室

电子邮件: xurong@iscas.ac.cn

通信地址: 北京市海淀区中关村南四街4号中科院软件园5号楼715

邮政编码:

研究领域

语音和语言处理、智慧医疗与康复、神经语音解码、AI for Science、机器学习、认知科学

招生信息

   
招生方向
语音和语言处理,语音识别,语音合成
智慧医疗与康复,AI for Science,机器学习
神经语音解码,脑机接口,认知科学

个人简介

谢旭荣研究方向包括语音和语言处理(如语音识别与合成)、智慧医疗与康复、脑机接口(如神经语音解码)、AI for Science等,在语音领域顶会Interspeech、ICASSP,顶刊TASLP等共发表论文50余篇,提出的神经网络声学模型贝叶斯自适应技术获得语音处理领域顶会ICASSP 2019最佳论文奖,作为负责人带领团队获得国际会议ISCSLP 2024多模态构音障碍严重程度评估挑战赛季军,作为技术负责人研发的言语障碍语音处理系统在构音及认知障碍语音识别、检测、重建等方面均取得国际先进性能,在多个公开数据上得到国际最前沿效果。加入软件所之前他先后在UCL Gatsby计算神经科学中心、中国科学院深圳先进技术研究院环绕智能与多模态系统研究实验室、香港中文大学电子工程系数字信号处理与语音技术实验室、语言与沟通障碍研究中心、系统工程与工程管理系等学习及工作,获“中国科学院软件研究所优秀青年科技人才计划”、“中国科学院青年创新促进会会员”人才类项目资助。所指导的毕业生在清华大学、微软、腾讯、华为等学术界和工业界知名机构任职。

科研主页:


ResearchGate https://www.researchgate.net/profile/Xurong-Xie/research

Google Scholar https://scholar.google.com/citations?hl=en&user=bGD7wa0AAAAJ

科研活动

非侵入神经机接口解码

我们基于人工智能、信号处理和神经科学理论及技术,研究从EEG脑电信号、外周神经信号(如心电、肌电)等非侵入神经信号解码交互任务中的被试状态信息,如(发声/意图/想象)语音内容、语义意图、情感及认知状态等信息


智能交互技术用于言语及认知障碍辅助

我们通过人工智能和人机交互技术,研究在语音、语言、视觉等多通道交互任务中辅助言语及认知相关障碍的筛查诊断、语音识别、语音重建及康复训练


智能语音和语言处理技术

我们长期研究一般智能语音和语言处理技术(如语音识别、语音合成),包括但不限于复杂条件自适应、数据扩张、快速解码、语音情感建模、噪声/混叠语音识别/分离、语音编码等,涉及技术如语音及语言建模、大模型微调、强化学习、贝叶斯推断、多模态建模、优化算法等;此外我们也开展AI技术辅助的语言学及认知科学研究

科研项目
( 1 ) 中国科学院软件研究所重大项目:人机增强智能计算平台, 参与, 研究所自主部署, 2024-06--2026-05
( 2 ) 中国残联课题残疾人事业综合课题研究-孤独症谱系障碍儿童情感社交康复训练系统开发及应用研究, 参与, 国家任务, 2024-03--2027-12
( 3 ) 中国科学院软件所优秀青年科技人才计划, 负责人, 研究所自主部署, 2023-12--2026-12
( 4 ) 重庆市技术创新与应用发展专项重大项目“汽车核心软件研发重大专项”:高可信多通道融合交互框架与关键工具研发, 参与, 地方任务, 2023-12--2026-12
( 5 ) 多模态交互软件, 参与, 国家任务, 2023-06--2024-11
( 6 ) 中国科学院青年创新促进会项目, 负责人, 中国科学院计划, 2023-03--2027-03
( 7 ) 新一代人工智能”重大项目"面向神经系统疾病预警的智能人机交互关键技术", 参与, 国家任务, 2023-03--2027-03
( 8 ) "新一代人工智能"重大项目"面向神经系统疾病预警的智能人机交互关键技术"子课题“自然交互场景认知神经功能解析”, 负责人, 国家任务, 2023-03--2027-03
( 9 ) 广州市民政局“揭榜挂帅”项目:基于依恋理论的困境儿童情绪行为问题早期干预研究, 参与, 地方任务, 2023-01--2025-12
( 10 ) 国家自然科学基金青年项目:面向构音障碍者的个性化语音重构方法研究, 负责人, 国家任务, 2022-01--2024-12
( 11 ) 科技部国家重点研发计划-发声与言语功能障碍康复训练系统:汉语发声与言语器官运动多模态数据获取与处理, 参与, 国家任务, 2020-07--2023-06
( 12 ) 国家自然科学基金通用技术联合基金重点支持项目:复杂环境下语音数据的目标识别与内容转写, 参与, 国家任务, 2018-01--2021-12

指导学生

现指导学生

郑天  硕士研究生  083500-软件工程  

陈易翔  硕士研究生  085405-软件工程  

协作指导学生

江怡聪(硕博连读,国科大)

宋祺(博士生,国科大)

王昊铭(硕士生,北交大)

王慧猛(博士生,港中文)

陈友钧(博士生,港中文)

邓成玺(博士生,港中文)

王天资(博士生,港中文,已毕业)

胡书杰(博士生,港中文,已毕业)

朱一瞳(硕士生,国科大,已毕业)

吕承辰(博士生,国科大,已毕业)

金增瑞(博士生,港中文,已毕业)

邓佳俊(博士生,港中文,已毕业)

耿萌哲(博士生,港中文,已毕业)

教育背景

学士:中山大学 哲学专业

学士:中山大学 数学与应用数学专业

硕士:伦敦大学学院(UCL)计算统计与机器学习专业

博士:香港中文大学 电子工程学专业

学术兼职

2025-09-25-2029-09-25,中国康复医学会言语康复专业委员会委员

2024-08-18-今,CCF语音对话与听觉专业委员会执行委员

2023-08-24-今,CCF人机交互专业委员会执行委员