首站-论文投稿智能助手
典型文献
基于迁移学习与强化学习的自动音频标注系统
文献摘要:
自动音频标注是让计算机为一段音频自动生成标注语句来对该片段进行描述的任务.针对当前音频标注模型不够有效,且模型训练目标与评价指标得分之间不一致的问题,本文提出了一种基于CNN-Transformer的编码器-解码器结构,并采用强化学习进行微调的方法,同时采用了迁移学习为编码器提供一个预训练网络来初始化参数.在Clotho数据集上的实验结果表明,与基线系统相比,该方法能够提升模型的有效性,而通过强化学习对模型进行微调同样大幅提高了优化对象指标的得分.
文献关键词:
自动音频标注;强化学习;迁移学习;深度学习
作者姓名:
陈耕耘;李圣辰;邵曦;梅昕浩;刘徐博;黄秋实;王文武
作者机构:
南京邮电大学通信与信息工程学院,江苏南京210003;西交利物浦大学先进工程学院,江苏苏州215123;萨里大学电子与电气工程学院,英国萨里郡吉尔福德GU2 4BB
引用格式:
[1]陈耕耘;李圣辰;邵曦;梅昕浩;刘徐博;黄秋实;王文武-.基于迁移学习与强化学习的自动音频标注系统)[J].复旦学报(自然科学版),2022(05):520-526
A类:
自动音频标注,Clotho
B类:
迁移学习,强化学习,标注系统,自动生成,语句,该片,模型训练,Transformer,编码器,解码器,微调,预训练,初始化
AB值:
0.243398
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。