ENGLISH

电子新闻

电子系研究生在第25届模式识别国际会议阿拉伯文视频文本检测与识别竞赛中夺冠

发布时间:2021-03-15 点击数:

在近日线上举行的第25届模式识别国际会议(International Conference onPattern Recognition,ICPR)上,第三届阿拉伯文视频文本检测与识别竞赛结果揭晓。清华大学电子工程系媒体大数据认知计算研究中心彭良瑞副教授指导的博士生闫睿劼、硕士生肖善誉等提交的算法在文本检测和文本识别全部两项任务中均获得第一名。

阿拉伯文视频文本检测与识别竞赛(Competition on Text Detection and Recognition in Arabic News Video Frames, AcTiVComp)由瑞士西部应用科学大学、弗莱堡大学和突尼斯苏斯大学主办。参赛队伍来自中国、瑞士、马来西亚、挪威、印度、巴基斯坦等多个国家的高校与学术机构。

阿拉伯文视频文本检测获奖证书

阿拉伯文视频文本识别获奖证书

阿拉伯文等多文种文字识别技术在促进全球化时代信息交流及利用中具有重要作用,并且也是机器学习和人工智能研究领域的前沿课题。在彭良瑞的指导下,参加阿拉伯文视频文本检测与识别算法研究的研究生包括闫睿劼(2017级博士生)、肖善誉(2019级硕士生)、姚刚(2019级博士生)、石浩东(2020级硕士生)等。所提交的文本检测算法由肖善誉同学负责研制,在深度学习模型架构设计和多任务监督学习机制方面进行了创新研究;所提交的视频文本识别算法由闫睿劼同学负责研制,在高效特征表示学习和迁移学习方面取得了突破进展。此前,彭良瑞研究组曾在2017年ICDAR国际会议上的阿拉伯文视频文本检测与识别竞赛全部两项任务中取得领先成绩,本次参赛算法与2017年的算法相比,在文本检测和文本识别方面都有大幅度的提升。

本次参赛算法相关研究工作得到科技部重点专项、清华大学国强研究院以及北京信息科学与技术国家研究中心的资助。

分享到: