电子工程系

Department of Electronic Engineering

电子系研究生肖善誉等荣获ICDAR 2019最佳学生论文奖

近日,清华大学电子系2019级硕士生肖善誉和2017级博士生闫睿劼在第15届国际文档分析与识别国际会议(ICDAR 2019)上发表论文“基于像素级矫正与稳健训练深度网络的手写文字识别”,并获得ICDAR 2019 “Best Student Paper Runner-Up Award”。论文作者为电子系的硕士生肖善誉、副教授彭良瑞、博士生闫睿劼和教授王生进。肖善誉、闫睿劼和导师彭良瑞副教授出席了日前在澳大利亚悉尼召开的ICDAR 2019会议。论文第一作者肖善誉在会议上作口头报告,并在报告后的问答环节回答了与会专家的提问。

ICDAR 2019会议主席Michael Blumenstein教授(右)为肖善誉(左)颁奖。

ICDAR 是国际模式识别学会主办的文字识别领域规模最大的国际学术会议,自1991年起,每两年举办一次。ICDAR 2019论文投稿总数为403篇,论文口头报告录用52篇,录用率约为13%,另有176篇论文张贴报告录用,参会人数为500多人。

ICDAR 2019 最佳学生论文奖第二名证书。

手写文字识别是一种将手写文档图像转换为可全文检索文本的人工智能技术,是文字识别领域具有挑战性的经典课题。深度神经网络是当前机器学习领域的主流技术。对于书写风格变化大和训练标定样本数量有限的手写文字,如何设计深度网络寻求稳定的特征表示,并且提高模型在测试样本上的泛化能力是至关重要的问题。论文在特征提取层面引入一种基于卷积神经网络的像素级笔画形变矫正方法,并引入多种正则化稳健训练策略,最终在英文、法文、阿拉伯文三个国际公开手写文字样本集上取得全面优于文献已有报道方法的结果。这一研究成果对于自然场景图像文字识别等其他研究课题也具有借鉴意义。