日前,由语音社区志愿者组织SpeechColab和清华电子系语音与音频技术实验室,联合语音社区的8个团队,在语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等的大力支持下,通过清华天津电子院AI大数据中心发布了全球最大的多领域英语开源数据集—GigaSpeech。它拥有10000小时的高质量标注音频,比主流的LibriSpeech、TED-LIUM等大一个数量级;且题材丰富多样,远超目前主流的开源数据集。不久前,介绍该数据集的论文....