基本信息

刘斌 男 硕导 中国科学院自动化研究所
电子邮件: liubin@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号智能化大厦710
邮政编码:
部门/实验室:模式识别国家重点实验室
电子邮件: liubin@nlpr.ia.ac.cn
通信地址: 北京市海淀区中关村东路95号智能化大厦710
邮政编码:
部门/实验室:模式识别国家重点实验室
招生信息
招生专业
081104-模式识别与智能系统
招生方向
情感计算,语音与音频处理,人机交互
教育背景
2011-09--2015-07 中科院自动化所 工学博士2007-09--2009-07 北京理工大学 工学硕士2003-09--2007-07 北京理工大学 工学学士
工作经历
工作简历
2018-11~现在, 中科院自动化所, 副研究员2015-07~2018-10,中科院自动化所, 助理研究员
社会兼职
2019-11-29-今,中国图象图形学学会人机交互专委会秘书长,
2018-12-28-今,中国人工智能学会情感智能专委会秘书长,
2018-12-28-今,中国人工智能学会情感智能专委会秘书长,
教授课程
情感计算
专利与奖励
奖励信息
(1) The 2020 Multimodal Sentiment in-the-Wild Challenge Prize, 其他, 2020(2) 第9届计算与模式识别国际会议最佳论文, , 其他, 2020(3) 第十九届全国信号处理学术年会最佳论文, , 其他, 2019(4) 第十三届全国人机语音通讯学术会议最佳论文, , 其他, 2015(5) 具有个性化自适应能力的高性能语音处理技术及应用, 二等奖, 省级, 2014
专利成果
( 1 ) 一种高效的语音检测方法, 发明, 2013, 第 2 作者, 专利号: 201310743203.5( 2 ) 音频数据的编码方法及解码方法, 发明, 2012, 第 2 作者, 专利号: 201210487489.0( 3 ) 一种语音数据的编码及解码方法, 发明, 2013, 第 2 作者, 专利号: 201310176701.6( 5 ) 发音器官可视语音合成系统, 发明, 2012, 第 4 作者, 专利号: 201210265448.7( 6 ) 语音识别中的正则化口音自适应方法, 发明, 2016, 第 4 作者, 专利号: 201610971766.3( 7 ) 基于LSTM循环神经网络的基频提取模型及训练方法, 发明, 2016, 第 4 作者, 专利号: 201611030326.4( 8 ) 语音带宽扩展模型的训练方法及语音带宽扩展方法, 发明, 2016, 第 2 作者, 专利号: 201610634660.4( 9 ) 基于微表情视频的视频特征提取方法、微表情识别方法, 发明, 2019, 第 3 作者, 专利号: 201910808102.9( 10 ) 面向交互场景的自动谎言检测方法、装置、设备及介质, 发明, 2021, 第 3 作者, 专利号: 202110001077.0( 11 ) 多模态谎言检测方法、装置、设备, 发明, 2021, 第 3 作者, 专利号: 202110001041.2( 12 ) 自动抑郁检测方法、装置、设备, 发明, 2021, 第 3 作者, 专利号: 202110001070.9
出版信息
发表论文
(1) CTNet: Conversational Transformer Network for Emotion Recognition, IEEE-ACM Transactions on Audio Speech and Language Processing, 2021, 通讯作者(2) Gated Recurrent Fusion with Joint Training Framework for Robust End-to-End Speech Recognition, IEEE/ACM Transactions on Audio, Speech and Language Processing, 2021, 第 5 作者(3) Multi-Scale and Multi-Region Facial Discriminative Representation for Automatic Depression Level Detection, ICASSP, 2021, 第 3 作者(4) Multimodal Cross- and Self-Attention Network for Speech Emotion Recognition, ICASSP, 2021, 第 2 作者(5) 多通道运动特征融合的微表情识别方法, 计算机辅助设计与图形学学报, 2021, 第 2 作者(6) End-to-End Post-Filter for Speech Separation With Deep Attention Fusion Features, IEEE/ACM Transactions on Audio, Speech and Language Processing, 2020, 通讯作者(7) Multimodal Transformer Fusion for Continuous Emotion Recognition, ICASSP, 2020, 第 3 作者(8) Multi-modal Continuous Dimensional Emotion Recognition Using Recurrent Neural Network and Self-Attention Mechanism, The 2020 Multimodal Sentiment in-the-Wild Challenge, 2020, 第 4 作者(9) Context-Dependent Domain Adversarial Neural Network for Multimodal Emotion Recognition, Interspeech, 2020, 第 3 作者(10) Conversational Emotion Recognition Using Self-Attention Mechanisms and Graph Neural Networks, Interspeech, 2020, 第 3 作者(11) Gated Recurrent Fusion of Spatial and Spectral Features for Multi-channel Speech Separation with Deep Embedding Representations, Interspeech, 2020, 第 3 作者(12) Comparison of glottal source parameter values in emotional vowels, Interspeech, 2020, 第 3 作者(13) Joint Training for Simultaneous Speech Denoising and Dereverberation with Deep Embedding Representations, interspeech, 2020, 第 3 作者(14) Learning Utterance-level Representationswith Label Smoothing for Speech Emotion Recognition, Interspeech, 2020, 第 3 作者(15) Hybrid Network Feature Extraction for Depression Assessment from Speech, Interspeech, 2020, 第 4 作者(16) AMINN: Attention-Based Multi-Information Neural Network for Emotion Recognition, ICCPR, 2020, 第 2 作者(17) Multimodal Spatiotemporal Representation for Automatic Depression Level Detection, IEEE Transactions on Affective Computing, 2020, 第 3 作者(18) 一种基于卷积神经网络的端到端语音分离方法, 信号处理, 2019, 第 2 作者(19) Conversational Emotion Analysis via Attention Mechanisms, Interspeech2019, 2019, 第 3 作者(20) Unsupervised Representation Learning with Future Observation Prediction for Speech Emotion Recognition, Interspeech2019, 2019, 第 3 作者(21) Automatic Depression Level Detection via lp-norm Pooling, Interspeech2019, 2019, 第 3 作者(22) Discriminative Learning for Monaural Speech Separation Using Deep Embedding Features, Interspeech2019, 2019, 第 2 作者(23) 基于迁移学习的噪声鲁棒语音识别声学建模, 清华大学学报:自然科学版, 2018, 第 3 作者(24) A Novel Pitch Extraction Based On Jointly Trained Deep BLSTM Recurrent Neural Networks With Bottleneck Features, ICASSP2017, 2017, 第 1 作者(25) Investigating Deep Network Adaptation for Generating Exclamatory and Interrogative Speech in Mandarin, Journal of Signal Processing Systems, 2017, 第 4 作者(26) CTC Regularized Model Adaptation for Improving LSTM-RNN Based Multi-Accent Mandarin Speech Recognition, Journal of Signal Processing Systems, 2017, 第 5 作者(27) Investigating Efficient Feature Representation Method and Training Object Function for BLSTM-based Phone Duration Prediction, Interspeech2017, 2017, 第 5 作者(28) Speech Enhancement Based on Analysis-Synthesis Framework with Improved Parameter Domain Enhancement, Journal of Signal Processing Systems, 2016, 第 1 作者(29) A Novel Research to Artificial Bandwidth Extension Based on Deep BLSTM Recurrent Neural Networks and Exemplar-based Sparse Representation, Interspeech2016, 2016, 第 1 作者(30) Extraction of Tongue Contour in Real-time Magnetic Resonance Imaging Sequences, ICASSP2016, 2016, 第 5 作者(31) A Novel Method of Artificial Bandwidth Extension Using Deep Architecture, Interspeech2015, 2015, 第 1 作者(32) 一种改进的基于分析合成框架的语音增强算法, 全国人机语音通讯学术会议, 2015, 第 1 作者(33) Estimate Articulatory MRI Series From Acoustic Signal Using Deep Architicture, ICASSP2015, 2015, 第 4 作者(34) A Hierarchical Viterbi Algorithm for Mandarin Hybrid Speech Synthesis System, Interspeech2014, 2014, 第 5 作者
科研活动
科研项目
( 1 ) 情感语音音色分析及补偿方法研究, 主持, 国家级, 2018-01--2021-12( 2 ) 基于麦克风阵列的多源语音处理技术研究, 主持, 部委级, 2017-09--2020-08( 3 ) 面向虚拟听觉的个性化头相关传递函数自适应研究, 主持, 国家级, 2017-01--2019-12( 4 ) 大数据分析, 参与, 部委级, 2019-01--2023-12( 5 ) 连续状态空间个性化语音情感识别, 参与, 国家级, 2019-01--2023-12( 6 ) 面向移动终端的多模态自然交互技术, 参与, 国家级, 2015-01--2017-12( 7 ) 云端融合的交互意图理解核心算法, 参与, 国家级, 2016-07--2020-06( 8 ) 语音技术开发, 参与, 院级, 2015-01--2018-12( 9 ) 人工智能技术研究, 参与, 院级, 2017-01--2017-12( 10 ) 基于音视频的精神压力分析, 主持, 国家级, 2019-06--2020-06( 11 ) 多模态情感识别技术, 参与, 院级, 2019-07--2022-06( 12 ) 大数据多模态协同关键技术, 参与, 国家级, 2017-10--2021-09( 13 ) 言语置信度分析, 参与, 院级, 2016-12--2018-12( 14 ) 情绪与决策倾向关联与预测, 参与, 国家级, 2020-07--2021-06( 15 ) 情感识别技术研发, 参与, 院级, 2019-06--2020-05( 16 ) 心理实验范式设计和预实验验证技术, 参与, 院级, 2020-12--2023-04( 17 ) 高频脑电信号采集与处理技术, 参与, 院级, 2020-12--2023-04
指导学生
现指导学生
凡佳辉 硕士研究生 085400-电子信息
柳晗 硕士研究生 085400-电子信息