华夏时讯

自动化所噪声环境下语音识别性能研究取得进展

在互联网和移动互联网时代,以PC和智能手机为载体的图形视觉交互是最主要的人机交互方式,占据了绝大部分用户流量入口。在更多智能设备的物联网时代,除了触屏之外,语音交互被普遍视为最有可能成为下一代信息、内容以及服务的核心入口之一。目前,语音交互赛道已汇集了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及各类人工智能初创公司,特别是近几年以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音交互技术的应用和发展。深度学习的突破极大地促进了语音识别技术的发展。目前语音识别系统在近场环境下已取得相当好的性能,甚至超过人类水平。然而在真实环境中,语音信号不可避免地受到噪声和混响的干扰,特别在远场条件下,由于声波在传播过程中其能量随传播距离呈指数衰减,语音信号受到噪声和混响的干扰更加严重,极大地影响了语音识别等语音交互应用的性能。

为了提高语音识别系统的噪声鲁棒性,最直接的手段就是收集大量真实环境的语音数据进行带噪训练。这种方法虽然简单,但真实环境复杂多变,数据收集和训练的代价比较大,很难覆盖所有应用场景,性能提升比较有限。另外一种重要的方法是采用语音增强作为语音识别系统的前端处理模块。一方面会带来处理流程和计算消耗的增加,甚至可能增加硬件成本(基于麦克风阵列的多通道语音增强),另一方面语音增强算法一般会基于自身的优化准则,并没有直接优化语音识别目标,消除噪声的同时可能会带来语音畸变。语音识别模型的噪声鲁棒性问题主要来源于纯净训练数据和带噪测试数据的分布差异。

生成式对抗网络(GAN, Generative Adversarial Networks)是最近极为流行的无监督生成模型。通过对抗训练的方式,它能够连续逼近指定的数据分布。GAN通常由生成器和判别器组成,生成器用来生成样本,判别器用来判断样本是否来自真实训练集。二者进行对抗训练,使得生成器生成的样本尽可能逼近真实训练数据。GAN不仅在图像领域取得了巨大的成功,在语音领域也有许多应用,例如语音转换、合成、增强等。

针对语音识别系统在噪声环境下识别性能下降的问题,中国科学院自动化研究所智能交互团队提出了深度对抗和声学模型联合训练的框架。该框架由生成器(G)、判别器(D)以及分类器(C)组成。生成器用来把带噪语音数据分布变成纯净语音;判别器用来判定语音信号是否来自真实纯净训练集;声学模型作为分类器,指导生成器提取区分性特征。生成器、判别器和声学模型进行联合对抗训练,三者相互配合相互促进。

通过深度对抗的联合训练策略,有效减小了噪声环境语音数据和真实训练数据的分布差异,提升了声学模型的鲁棒性。相对于语音增强方法,该框架没有增加计算的流程和复杂度,而且不需要一一对应的带噪数据和纯净数据,可作为通用训练框架提升已有声学模型的噪声鲁棒性。研究人员将提出的方法在Chime-4数据集上进行实验,评价标准为词错误率。结果显示:测试集上超过了基线系统(29.29 vs 33.11),效果良好,验证了该方法的有效性。该研究组在基于深度对抗训练的领域自适应问题上进行了系列深入研究,目前已在OCR、鲁棒性语音识别和语音增强等领域取得多项优秀成果。

相关成果发布在ICASSP2018上,并获得最佳学生论文奖。

 自动化所噪声环境下语音识别性能研究取得进展

深度对抗训练框架

 
相关推荐
新闻聚焦
猜你喜欢
热门推荐
  • 昆明动物所等在冈瓦纳古陆和劳亚古陆物

      生物的地理分布与地球演化历史紧密相关。在现代生物地理学研究中,通过生物的演化历史可以推测地球的演化过程,并对已......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 中科院大连化物所化学链合成氨研究取得

      近日,中国科学院大连化学物理研究所复合氢化物材料化学研究组研究员陈萍、副研究员郭建平团队在化学链合成氨研究方面......

    11-05    来源:中国科学院|编辑:确牛

    分享
  • 研究揭示二穗短柄草MAPK与PP2C基因家族成

      日前,《科学报告》(Scientific Reports)杂志在线发表了中国科学院上海辰山植物科学研究中心植物抗逆与分子进化研究组题为......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 运动为啥能给人带来愉悦感

      持续运动不仅对身体有长期积极的影响,还能在运动后1-2 个小时内带来短效的益处,包括提高疼痛的阈限、降低急性焦虑和......

    11-05    来源:中国科学院|编辑:确牛

    分享
  • 中外学者热议农业可持续发展

      目前有很多好的智慧农业技术理念,但技术与农业的结合还不到位,须加大研发力度并完善全流程管理,将智慧农业的理念落......

    10-31    来源:中国科学院|编辑:确牛

    分享
  • 虫洞或可用于躲避星际战争

      如果外星人之间发生星际战争,而地球人打不过外星人,那么地球人应该怎么办?最新的虫洞研究也许可以给我们一定的启示......

    05-02    来源:科普时报|编辑:确牛

    分享
  • 纳米科技的喜与忧

      纳米材料的广泛应用及其带来的环境健康风险。 纳米氧化锌水环境老化对遗传毒性的影响。 不同种类纳米材料与污染物间截......

    11-04    来源:中国科学院|编辑:确牛

    分享
  • 特斯拉来了 国产电动汽车如何应对?

      随着特斯拉在上海建生产厂这一事件的最后落听,让新品频出、一直热闹的国内电动汽车行业顿然迷漫着一股狼来了的气氛。......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 智能巡查车:内外兼修铸就“火眼金晴”

      目前,交通道路分布面广,地形复杂,传统的人工巡查方法工作量大且条件艰苦,传统作业形式已经无法满足巡查巡视管理与......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 合肥研究院研制出纳米复合物可同时消除

      近期,中国科学院合肥物质科学研究院技术生物与农业工程研究所研究员吴正岩课题组在抗生素和重金属污染治理方面取得新......

    11-01    来源:中国科学院|编辑:确牛

    分享
返回列表
 
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。