电子工程系

Department of Electronic Engineering

杨毅    博士,副教授
地址:中国北京市海淀区清华大学电子工程系,100084
电话:+86-10-62781443
电子邮箱:yangyy@tsinghua.edu.cn

个人简介:
杨毅,女,博士,副教授,1978年7月生,籍贯山东,专业为信号与信息处理,杨毅于2007年4月获得北京科技大学模式识别与人工智能专业博士学位,杨毅于2011年6月清华大学电子工程系博士后出站后在清华大学电子工程系工作,研究领域为语音信号处理及人机交互感知技术。

 

教育背景

2001/09~2007/04,博士,北京科技大学自动化系模式识别与人工智能专业
1995/09~1999/07,学士,北京科技大学自动化系工业自动化专业

 

工作履历

2014/12~至今,      清华大学电子工程系,副教授
2011/06~2014/12,清华大学电子工程系,讲师
2009/06~2011/06,清华大学电子工程系,博士后
2007/04~2009/05,华为技术有限公司,    算法工程师

 

学术兼职

IEEE会员,ACM会员,CCF高级会员

 

社会兼职

 

研究领域

1、复杂信道条件下的语音及说话人识别技术;
2、语音增强及麦克风阵列技术;
3、大数据媒体分析与检索技术;
4、智能人机交互感知技术;
5、音视频编解码技术。

 

研究概况

1、 主持国家自然科学青年基金项目“基于分布式声传感器网络和量子优化学习的说话人分类标记研究”;
2、 作为技术骨干参加国家自然科学重大研究计划/重点支持项目“多人多方对话中的语音分离、内容分析与理解”,主要负责声源分离与标记技术研究;
3、 作为技术骨干参加863国家高技术研究发展计划项目“人性化语音交互技术研究”,主要负责麦克风阵列语音增强和声源定位技术研究;
4、 作为技术骨干参加北京市教育委员会科技计划重点项目“复杂场景下的高效语音增强技术研究”,主要负责基于语音编码的语音增强技术研究;
5、 作为技术骨干实现中国在ITU国际标准组织中首次语音编解码技术专利预埋成功,获得华为金牌团队奖章;
6、 担任AVS音频组测试组组长,负责国内AVS编解码技术标准的技术预埋,推动AVS音频申请国标,第一发明人专利已预埋至国内标准;

 

奖励与荣誉

2017年清华大学优秀班主任一等奖
2016年美国大学生数学建模竞赛(二等奖)指导教师
2016年清华大学第三十四届挑战杯学生竞赛优秀指导教师

 

学术成果

作为第一发明人已获得国家授权发明专利11项,其中国际公开专利2项:
1. 分布式麦克风阵列网络的鲁棒声源空间定位方法. 中国专利号:ZL201510808753.X
2. 一种具有自定义功能的音频检测分类方法. 国际公开号:WO2015124006-A1. 国际专利申请号:PCT/CN2014/091959.
3. 一种基于参数融合优化决策的音频索引方法. 中国专利号:ZL201410209057.2.
4. 基于稀疏降维的说话人识别方法.中国专利号:ZL201310298757.9.
5. 一种基于局部学习的说话人识别方法. 中国专利号 : ZL201210548563.5.
6. 一种基于多距离声传感器的音频索引方法. 中国专利号:ZL201110303580.8.
7. 一种分布式麦克风的说话人聚类方法. 中国专利号 : ZL201010568386.8.
8. 一种分布式非同步声传感器的声源空间定位方法. 中国专利号 : ZL201010568360.3.
9. 基音后处理方法、滤波器以及基音后处理系统. 国际公开号:WO2009140896A. 国际专利申请号:PCT/CN2009/071708.
10. 一种语音增强的方法和装置. 中国专利号:ZL200910132345.1.
11. 一种语音信号增强方法及装置. 中国专利号:ZL200810198772.5.

近五年发表的部分论文及专著:
[1] Y. Yang, et al. Speech Activity Detection and Speaker Localization Based on Distributed Microphones[C]. International Conference on Human-Computer Interaction. Springer International Publishing, 2016: 392-400.
[2] Y. Yang, Design and Implementation of Advanced HCI Education[C]. International Conference on Human-Computer Interaction. Springer International Publishing, 2016: 84-90.
[3] Sun Jiasong, Zhang Jingyun, Yang Yi. Effective audio fingerprint retrieval based on the spectral sub-band centroid feature[J]. Journal of Tsinghua University (Science and Technology), 2017, 57(4): 382-387.
[4] Y. Yang, et al. Local Learning Multiple Probabilistic Linear Discriminant Analysis[C]. International Conference on Human-Computer Interaction. Springer International Publishing, 2015: 604-610.
[5] Y. Yang, et al. New Research Methods for Media and Cognition Experiment Course[C]. International Conference of Design, User Experience, and Usability. Springer International Publishing, 2015: 327-334.
[6] Yang Y., Liu J., Exploring the Large-Scale TDOA Feature Space for Speaker Diarization, International Conference, HCI International 2014, Jun.22- Jun.29, pp: 551-556, 2014.
[7] Yang Y., Liu J., Dereverberation for Speaker Identification in Meeting, International Conference, HCI International 2014, Jun.22- Jun.29, pp: 594-599, 2014.
[8]杨毅等,大数据信息处理技术导论,北京: 电子工业出版社,2017.
[9]杨毅等,跨媒体信息技术与应用,北京: 电子工业出版社,2013.
[10]杨毅等,跨媒体信息技术导论,北京:电子工业出版社,2012.
[11]何亮、杨毅、刘加,基于TLS-NAP的文本无关说话人识别算法,模式识别与人工智能, 06期, pp 916-921, 2012.