清华大学学术专著《文字识别原理、方法和实践》近日由清华大学出版社出版。文字识别是模式识别领域的研究热点问题,近30年来在各国学者的共同努力下,取得了丰硕的研究成果。清华大学丁晓青教授出版的《文字识别原理、方法和实践》基于模式识别和信息熵理论分析,对文字和文档识别的理论和方法及其关键问题进行了深入、系统的分析和研究,本书从汉字识别到民族文字识别,从文字识别到文档识别,从原理到实践,从研究到工程,从局部到整体,提供了文字识别领域知识(domain knowledge)的一种立体视角。即使在深度学习广受青睐的今天,对领域知识的深入理解和掌握仍然是至关重要的。领域知识与深度学习的有机结合将会产生更多的突破性成果。
丁晓青教授,清华大学电子工程系教授,博士生导师,IEEE Life Fellow、IAPR Fellow,中国通信学会会士。主要研究方向为智能图文信息处理、模式识别、图像处理、文字识别、生物特征识别、智能视频监控等。她提出的“模式识别统一信息熵理论”对模式识别系统的设计有重要的指导作用,受到国内外学者的重视。在文字识别和人脸识别等计算机视觉模式识别领域,取得了一系列国际领先的研究成果,形成TH-OCR 系列文字识别软件和TH-ID生物特征(人脸、笔迹等)身份认证软件产品,并成功地进行了产业化推广。发表包括IEEE PAMI在内的论文550余篇,合作专著7本,有31项授权发明专利。先后荣获国家科技进步二等奖3次(2008、2003和1999年)、三等奖1次(1992年),以及10多项省部级奖励。
作者所在的清华大学智能图文信息处理研究室,自20世纪80年代起开始汉字及多文种文字、文档识别的信息化探索,数十位师生持续卅余年,齐心奋力,在文字识别的理论和方法研究上、在大规模印刷、联机和脱机手写汉字识别、中日韩、蒙藏维哈柯阿民族文字文档识别的研究上取得了多项国际领先的研究成果,并成功的进行了产业化推广,汉日韩文字识别核心授权微软公司在Office软件中使用,TH-OCR系列成为世界知名的文字识别软件品牌,带动了整个行业水平的提升。该书的内容主要源自研究组对文字和文档识别理论和方法的研究和探索,特别是汉字识别研究开创者之一,已故的吴佑寿院士,他的一贯支持,为汉字识别研究成功发挥了重要作用。刘长松副教授、彭良瑞副教授进行了长期的工作,为科技成果的产业化推广做出了突出贡献。