电子工程系

Department of Electronic Engineering

清华电子系彭良瑞研究组在2017文档分析与识别国际会议阿拉伯文视频文本检测与识别竞赛中夺冠

近日,在日本京都召开的第14届文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)上,首届阿拉伯文视频文本检测与识别竞赛结果揭晓。清华大学电子工程系媒体大数据认知计算研究中心彭良瑞副教授研究组在文本检测全部七项子任务上夺冠,并在文本识别七项子任务中的三项上获得第一名。

竞赛组织方为获胜者颁奖。右二为彭良瑞副教授,右三为彭良瑞课题组博士生闫睿劼。

文档分析与识别国际会议是国际模式识别学会自1993年起主办的文字识别领域最为重要的国际学术会议。近年来,由于阿拉伯文视频文字识别逐渐成为文字识别领域的研究热点之一,文档分析与识别国际会议在2017年首次组织“阿拉伯文视频文本检测与识别”(Arabic Text Detection and Recognition in Multiresolution Video Frames, AcTiV)竞赛。该竞赛由瑞士弗莱堡大学等单位承办,包括文本检测与文本识别两项任务。竞赛所用视频样本涵盖了不同字体、文字大小、前景颜色以及背景复杂度等变化。参赛者包括清华大学、中国科学院自动化研究所、突尼斯斯法克斯 (Sfax)大学等高校与学术机构。

阿拉伯文视频文本检测获奖证书。

阿拉伯文视频文本识别获奖证书。

彭良瑞研究组所提交的参赛算法为最新研制的基于深度学习的视频文本检测与识别方法。其中,视频文本检测算法采用基于卷积神经网络的方法,视频文本识别算法采用基于循环神经网络的方法。参加算法研究的学生包括闫睿劼、向东来、王雅琪、王学诚、陈立人和郭家明等。彭良瑞研究组所属的电子工程系智能图文信息处理研究室在多文种文字识别、人脸识别、视频监控等领域具有长期深厚的研究基础。