华夏时讯

声学所建立基于小波谱图和深度卷积网络的音频场景识别新框架

近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。

音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应反射。传统的音频分类任务大都使用短时特征,如梅尔频率倒谱系数等。然而,环境信息一般隐藏在不同时长的背景声中,因此提取多分辨率多尺度的特征是音频场景分类的关键。

近期,中国科学院声学研究所语言声学与内容理解重点实验室博士生陈航艇及其导师张鹏远等人提出了一种基于小波变换和深度卷积神经网络的场景识别新方法。相关研究成果已被Proceedings of the Annual Conference of the International Speech Communication Association(2018)收录。

研究人员提出的音频场景分类系统包括前端和后端两个模块。前端采用不同时长和频率分布的小波滤波器来提取小波谱图,此滤波器组可以同时捕捉到转瞬即逝的音频事件和长时的韵律节奏。后端的深度卷积神经网络结合小卷积核和池化操作,将“高维语义”从原始特征中抽象出来。

在相关场景数据集上的实验结果表明,使用小波谱图和深度卷积神经网络的音频场景识别表现明显优于传统的短时特征。相比短时特征,长时的小波谱图的时间分辨率较低,一定程度上降低了存储和计算的要求。

该研究为音频场景的分析提供了新的前后端架构,为环境声音的研究提供了新思路。

参考文献: CHEN Hangting, ZHANG Pengyuan, BAI Haichuan, YUAN Qingsheng, BAOXiuguo, YAN Yonghong. Deep Conventional Neural Network with Scalogram for Audio Scene Modeling. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, v 2018-September, p 3304-3308. DOI: 10.21437/Interspeech.2018-1524.

 

声学所建立基于小波谱图和深度卷积网络的音频场景识别新框架

基于小波变换和深度卷积网络的场景识别系统(图/陈航艇)

 

相关推荐
新闻聚焦
猜你喜欢
热门推荐
  • 昆明动物所等在冈瓦纳古陆和劳亚古陆物

      生物的地理分布与地球演化历史紧密相关。在现代生物地理学研究中,通过生物的演化历史可以推测地球的演化过程,并对已......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 中科院大连化物所化学链合成氨研究取得

      近日,中国科学院大连化学物理研究所复合氢化物材料化学研究组研究员陈萍、副研究员郭建平团队在化学链合成氨研究方面......

    11-05    来源:中国科学院|编辑:确牛

    分享
  • 研究揭示二穗短柄草MAPK与PP2C基因家族成

      日前,《科学报告》(Scientific Reports)杂志在线发表了中国科学院上海辰山植物科学研究中心植物抗逆与分子进化研究组题为......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 运动为啥能给人带来愉悦感

      持续运动不仅对身体有长期积极的影响,还能在运动后1-2 个小时内带来短效的益处,包括提高疼痛的阈限、降低急性焦虑和......

    11-05    来源:中国科学院|编辑:确牛

    分享
  • 中外学者热议农业可持续发展

      目前有很多好的智慧农业技术理念,但技术与农业的结合还不到位,须加大研发力度并完善全流程管理,将智慧农业的理念落......

    10-31    来源:中国科学院|编辑:确牛

    分享
  • 虫洞或可用于躲避星际战争

      如果外星人之间发生星际战争,而地球人打不过外星人,那么地球人应该怎么办?最新的虫洞研究也许可以给我们一定的启示......

    05-02    来源:科普时报|编辑:确牛

    分享
  • 纳米科技的喜与忧

      纳米材料的广泛应用及其带来的环境健康风险。 纳米氧化锌水环境老化对遗传毒性的影响。 不同种类纳米材料与污染物间截......

    11-04    来源:中国科学院|编辑:确牛

    分享
  • 特斯拉来了 国产电动汽车如何应对?

      随着特斯拉在上海建生产厂这一事件的最后落听,让新品频出、一直热闹的国内电动汽车行业顿然迷漫着一股狼来了的气氛。......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 智能巡查车:内外兼修铸就“火眼金晴”

      目前,交通道路分布面广,地形复杂,传统的人工巡查方法工作量大且条件艰苦,传统作业形式已经无法满足巡查巡视管理与......

    11-01    来源:中国科学院|编辑:确牛

    分享
  • 合肥研究院研制出纳米复合物可同时消除

      近期,中国科学院合肥物质科学研究院技术生物与农业工程研究所研究员吴正岩课题组在抗生素和重金属污染治理方面取得新......

    11-01    来源:中国科学院|编辑:确牛

    分享
返回列表
 
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。