基本信息
张恒  男  硕导  中国科学院自动化研究所
电子邮件: heng.zhang@ia.ac.cn
通信地址: 北京市海淀区中关村东路95号自动化大厦
邮政编码:

研究领域

多模态文档图像智能分析和识别,包括自然场景图像、手写文本图像、平板在线手写笔迹、古籍等多种模态下的文档图像分析与理解,研究方向包括但不限于自然场景文字识别、手写文字识别、签名鉴定等

​基于国际领先的模式识别与机器学习技术,将图片上的文字内容,自动识别成可编辑的文本。支持手写体、印刷体以及自然场景中的文字识别,包括身份证、名片、工作证等卡片类,也支持货运单、票据、个人笔记、政府公文等特定场景的文档图像识别,还可对复杂自然场景图片中的文字进行检测和识别,相关科研成果广泛应用于手机终端、数字地图、智能教育和国家安全领域。相关科研成果发表在模式识别和文字识别重要期刊和会议论文中,包括ICFHR2022最佳论文一篇,入选中国科协——科技期刊双语传播工程一篇。


招生信息

   
招生专业
081104-模式识别与智能系统
招生方向
文字识别,文档图像分析与识别

教育背景

2007-09--2013-07   中国科学院大学——中科院自动化研究所   工学博士学位
2003-09--2007-07   中国科学技术大学——教改试点班   工学学士学位

工作经历

   
工作简历
2015-10~现在, 中国科学院自动化研究所, 副研究员
2013-07~2015-10,中国科学院自动化研究所, 助理研究员
社会兼职
2019-05-17-今,文档图像分析与识别专委会, 委员

专利与奖励

   
专利成果
( 1 ) 基于语义图谱的短文本特征扩展方法, 发明专利, 2015, 第 4 作者, 专利号: CN104391942A

( 2 ) 基于非监督关键二元词串提取的微博文本自动摘要方法, 发明专利, 2014, 第 3 作者, 专利号: CN104216875A

出版信息

   
发表论文
(1) Improved Learning for Online Handwritten Chinese Text Recognition with Convolutional Prototype Network, ICDAR2023, 2023, 第 2 作者
(2) 基于多尺度注意力机制的场景文本擦除, 模式识别与人工智能, 2022, 第 2 作者
(3) An efficient prototype-based model for handwritten text recognition with multi-loss fusion (best paper award), ICFHR, 2022, 第 2 作者
(4) Regularing CTC in Expectation-Maximization Framework with Application to Handwritten Text Recognition, IJCNN2021, 2021, 第 2 作者
(5) Handwritten text recognition with convolutional prototype network and most aligned frame based CTC training, ICDAR, 2021, 第 2 作者
(6) 基于跨模态深度度量学习的甲骨文字识别, 自动化学报, 2021, 第 2 作者
(7) Oracle Character Recognition by Nearest Neighbor Classification with Deep Metric Learning, 2019, 第 2 作者
(8) Keyword spotting in handwritten chinese documents using semi-markov conditional random fields, ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE, 2017, 第 1 作者
(9) Improving short text classification by learning vector representations of both words and hidden topics, KNOWLEDGE-BASED SYSTEMS, 2016, 第 1 作者
(10) Semantic Clustering and Convolutional Neural Network for Short Text Categorization, PROCEEDINGS OF THE 53RD ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL) AND THE 7TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (IJCNLP), VOL 2, 2015, 第 5 作者
(11) Word embedding clustering and convolutional neural network for short text categorization, ACL-IJCNLP 2015, 2015, 第 5 作者
(12) Semantic Clustering and Convolutional Neural Network for Short Text Categorization, 2015, 第 4 作者
(13) A Robust Framework for Short Text Categorization based on Topic Model and Integrated Classifier, INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2014, 第 2 作者
(14) Short Text Hashing Improved by Integrating Topic Features and Tags, NEURAL INFORMATION PROCESSING, 2014, 第 5 作者
(15) Character confidence based on N-best list for keyword spotting in online Chinese handwritten documents, PATTERN RECOGNITION, 2014, 第 1 作者
(16) A Robust Framework for Short Text Categorization based on Topic Model and Integrated Classifier, PROCEEDINGS OF THE 2014 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 2014, 第 2 作者
(17) Keyword Spotting in Online Chinese Handwritten Documents with Candidate Scoring Based on Semi-CRF Model, INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), 2013, 第 1 作者
(18) KEYWORD SPOTTING FROM ONLINE CHINESE HANDWRITTEN DOCUMENTS USING ONE-VERSUS-ALL CHARACTER CLASSIFICATION MODEL, INTERNATIONAL JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2013, 第 1 作者
(19) Keyword Spotting in Online Chinese Handwritten Documents with Candidate Scoring Based on Semi-CRF Model, 2013 12TH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), 2013, 第 1 作者
(20) 联机手写维吾尔文字母识别方法, A Method for Online Handwritten Uyghur Character Recognition, 模式识别与人工智能, 2012, 第 2 作者
(21) An effective character separation method for online cursive Ughur handwriting, CHINESE CONFERENCE ON PATTERN RECOGNITION (CCPR 2012), 2012, 第 2 作者
(22) A method for online handwritten Uyghur character recognition, CHINESE JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2012, 第 2 作者
(23) A Confidence-Based Method for Keyword Spotting in Online Chinese Handwritten Documents, 2012 21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012), 2012, 第 1 作者
(24) An Effective Character Separation Method for Online Cursive Uyghur Handwriting, PATTERN RECOGNITION, 2012, 第 2 作者
(25) A lattice-based method for keyword spotting in online Chinese handwriting, INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), 2011, 第 1 作者
(26) Keyword spotting from online Chinese handwritten documents using one-vs-all trained character classifier, INTERNATIONAL CONFERENCE ON FRONTIERS IN HANDWRITING RECOGNITION (ICFHR), 2010, 第 1 作者

科研活动

   
科研项目
( 1 ) 面向数字人文的中文古籍文档图像智能识别与理解——文本识别, 负责人, 国家任务, 2020-01--2024-12
( 2 ) 复杂版面手写图文识别及理解关键技术研究, 参与, 国家任务, 2021-01--2024-12
( 3 ) 城市场景三维感知和语义表达——场景文字识别, 负责人, 国家任务, 2022-01--2025-12
( 4 ) 大规模笔迹数据比对检索模型研究, 负责人, 国家任务, 2023-01--2025-12

指导学生

已指导学生

刘莹  硕士研究生  085211-计算机技术  

于明明  硕士研究生  081203-计算机应用技术  

现指导学生

李天佐  硕士研究生  085404-计算机技术  

凌禄蓉  硕士研究生  081104-模式识别与智能系统  

张敬尧  硕士研究生  085410-人工智能