首站-论文投稿智能助手
典型文献
基于TasNet的单通道语音分离技术的研究综述
文献摘要:
语音分离是声学信号处理中的一项基本任务,具有广泛的应用.得益于深度学习的发展,近年来单通道语音分离系统的性能有了显着提升.特别是,随着一种被称为时域音频网络(Time-domain audio separation Network,TasNet)的新语音分离方法被提出,语音分离技术的研究也逐步从基于时-频域的传统方法过渡至基于时域的方法.本文综述基于Tas-Net的单通道语音分离技术的研究现状与展望.在回顾基于时-频域的语音分离传统方法之后,本文重点介绍基于Tas-Net的Conv-TasNet模型以及DPRNN模型,并对比针对各模型的改进研究.最后,本文阐述目前基于TasNet的单通道语音分离模型的局限性,并从模型、数据集、说话人数量以及如何解决复杂场景下的语音分离等层面对未来的研究方向进行讨论.
文献关键词:
语音分离;时域音频网络;全卷积时域音频网络;双路径循环神经网络
作者姓名:
陆炜;朱定局
作者机构:
华南师范大学计算机学院,广东 广州 510631
文献出处:
引用格式:
[1]陆炜;朱定局-.基于TasNet的单通道语音分离技术的研究综述)[J].计算机与现代化,2022(11):119-126
A类:
TasNet,时域音频网络,DPRNN,全卷积时域音频网络,双路径循环神经网络
B类:
单通道语音分离,分离技术,声学,信号处理,基本任务,分离系统,显着,Time,domain,audio,separation,Network,新语,分离方法,频域,研究现状与展望,Conv,改进研究,说话,何解,复杂场景
AB值:
0.158255
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。