谢旭荣 男 副研究员 中国科学院软件研究所 人机交互技术与智能信息处理实验室
电子邮件: xurong@iscas.ac.cn
通信地址: 北京市海淀区中关村南四街4号中科院软件园5号楼715
邮政编码:
研究领域
语音和语言处理、智慧医疗与康复、神经语音解码、AI for Science、机器学习、认知科学
招生信息
招生方向
个人简介
谢旭荣研究方向包括语音和语言处理(如语音识别与合成)、智慧医疗与康复、脑机接口(如神经语音解码)、AI for Science等,在语音领域顶会Interspeech、ICASSP,顶刊TASLP等共发表论文50余篇,提出的神经网络声学模型贝叶斯自适应技术获得语音处理领域顶会ICASSP 2019最佳论文奖,作为负责人带领团队获得国际会议ISCSLP 2024多模态构音障碍严重程度评估挑战赛季军,作为技术负责人研发的言语障碍语音处理系统在构音及认知障碍语音识别、检测、重建等方面均取得国际先进性能,在多个公开数据上得到国际最前沿效果。加入软件所之前他先后在UCL Gatsby计算神经科学中心、中国科学院深圳先进技术研究院环绕智能与多模态系统研究实验室、香港中文大学电子工程系数字信号处理与语音技术实验室、语言与沟通障碍研究中心、系统工程与工程管理系等学习及工作,获“中国科学院软件研究所优秀青年科技人才计划”、“中国科学院青年创新促进会会员”人才类项目资助。所指导的毕业生在清华大学、微软、腾讯、华为等学术界和工业界知名机构任职。
科研主页:
ResearchGate https://www.researchgate.net/profile/Xurong-Xie/research
Google Scholar https://scholar.google.com/citations?hl=en&user=bGD7wa0AAAAJ
科研活动
非侵入神经机接口解码:
我们基于人工智能、信号处理和神经科学理论及技术,研究从EEG脑电信号、外周神经信号(如心电、肌电)等非侵入神经信号解码交互任务中的被试状态信息,如(发声/意图/想象)语音内容、语义意图、情感及认知状态等信息
智能交互技术用于言语及认知障碍辅助:
我们通过人工智能和人机交互技术,研究在语音、语言、视觉等多通道交互任务中辅助言语及认知相关障碍的筛查诊断、语音识别、语音重建及康复训练
智能语音和语言处理技术:
我们长期研究一般智能语音和语言处理技术(如语音识别、语音合成),包括但不限于复杂条件自适应、数据扩张、快速解码、语音情感建模、噪声/混叠语音识别/分离、语音编码等,涉及技术如语音及语言建模、大模型微调、强化学习、贝叶斯推断、多模态建模、优化算法等;此外我们也开展AI技术辅助的语言学及认知科学研究
科研项目
指导学生
现指导学生
郑天 硕士研究生 083500-软件工程
陈易翔 硕士研究生 085405-软件工程
协作指导学生
江怡聪(硕博连读,国科大)
宋祺(博士生,国科大)
王昊铭(硕士生,北交大)
王慧猛(博士生,港中文)
陈友钧(博士生,港中文)
邓成玺(博士生,港中文)
王天资(博士生,港中文,已毕业)
胡书杰(博士生,港中文,已毕业)
朱一瞳(硕士生,国科大,已毕业)
吕承辰(博士生,国科大,已毕业)
金增瑞(博士生,港中文,已毕业)
邓佳俊(博士生,港中文,已毕业)
耿萌哲(博士生,港中文,已毕业)
教育背景
学士:中山大学 哲学专业
学士:中山大学 数学与应用数学专业
硕士:伦敦大学学院(UCL)计算统计与机器学习专业
博士:香港中文大学 电子工程学专业
学术兼职
2025-09-25-2029-09-25,中国康复医学会言语康复专业委员会委员
2024-08-18-今,CCF语音对话与听觉专业委员会执行委员
2023-08-24-今,CCF人机交互专业委员会执行委员