7月12日,小米集团语音首席科学家Daniel Povey的清华大学杰出访问教授(Distinguished Visiting Professor)授聘仪式于清华大学电子工程系举行。清华大学电子工程系党委书记沈渊、信息认知与智能系统研究所王生进教授、高健东和李淼研究员、小米公司Kaldi团队相关人员出席。张超助理教授主持会议。

参会人员合影
沈渊在致辞中向与会人员介绍了Daniel Povey教授在语音社区的学术研究以及工业部署等方向上的卓越成果与杰出贡献。目前,Daniel Povey教授是小米集团语音首席科学家。他是著名开源语音识别工具 Kaldi的提出者和主要维护者,被业界称为 “Kaldi 之父”。Povey教授曾在 IBM Thomas J. Watson研究中心、微软研究院和约翰斯·霍普金斯大学担任科学家和副教授等职务。
随后,沈渊代表学校向Povey教授颁发杰出访问教授聘书并赠送纪念品。

沈渊(左)向Povey教授(右)颁发聘书
授聘仪式结束后,Povey教授分享了自己带领团队正在的进行的项目以及未来计划展开的研究项目,包括在语音识别方面的模型训练、部署和数据采集等方面的工作,以及可用于高效音频和图像生成的FlowMatching生成式模型。Povey教授还分享了对基于麦克风阵列的信号处理、更通用的机器学习框架和编程语言、机器人、以及分布式计算和文件系统的研究兴趣。Povey教授表示,非常期待未来有机会与清华师生进行相关领域的深入合作。

Povey教授讲话

讲座现场
Daniel Povey 个人简介
Daniel Povey教授毕业于英国剑桥大学,先后就职于 IBM 和微软。2012年加入美国约翰霍普金斯大学,任语言和语音处理中心副教授。2019年10月加入小米集团,担任集团语音首席科学家。2022年12月, Daniel Povey凭借在语音识别和声学建模方面的杰出贡献入选IEEE Fellow。
Daniel Povey教授是著名开源语音识别工具 Kaldi 的提出者和主要维护者,被业界称为 “Kaldi 之父”。Kaldi 项目在学术界和工业界都极具影响力,广泛应用于各研究机构和国内外知名公司,有力地推动了智能语音处理的产业化。Povey教授在语音处理和机器学习技术上做出了非常多的贡献。他首次将序列区分性训练方法应用于语音识别,他提出的 LF-MMI 建模方法至今仍为商用语音识别系统普遍使用的标准技术。他也是将深度学习用于语音识别领域的重要引领者,在语音识别中推广了时延神经网络,配合 LF-MMI 训练,是 2015-2020 年学术界和工业界普遍使用的最佳组合。他还是深度学习在声纹识别领域的重要引领者,提出的 X-vectors 方法是第一个取得成功并被普遍应用的深度学习说话人识别方法,广泛应用于工业界。他在国际顶级会议和期刊发表论文200多篇,谷歌学术引用近 46000 次,h-index 66,担任 Signal Processing Letters 的终身副主编。
供稿|信息认知与智能系统研究所
编辑|陶旋姿
审核|汪 玉 李冬梅