典型文献
基于数据合成和度量学习的台标检测与识别
文献摘要:
台标是视频的重要语义信息,其检测与识别面临类别多、结构复杂、区域小、信息量低、背景干扰大等难题.为提高模型的泛化能力,提出将台标图像叠加到背景图像中合成台标数据,来构建训练数据集.进一步,提出两阶段可伸缩台标检测与识别(scalable logo detection and recognition,SLDR)方法,其采用batch-hard度量学习方法快速训练匹配模型,确定台标类别.SLDR的检测与识别分离机制使得其可将检测目标扩展到未知类别.实验结果表明,合成数据可以有效提升模型的泛化能力和检测精度.实验亦显示SLDR方法在不更新检测模型的情况下,即可获得与端到端模型相当的精度.
文献关键词:
数据合成;度量学习;可伸缩;台标检测和识别
中图分类号:
作者姓名:
张广朋;张冬明;张菁;王川宁;王立冬;邹学强
作者机构:
北京工业大学信息学部,北京100124;国家计算机网络应急技术处理协调中心,北京100029;北京广播电视台,北京100022
文献出处:
引用格式:
[1]张广朋;张冬明;张菁;王川宁;王立冬;邹学强-.基于数据合成和度量学习的台标检测与识别)[J].软件学报,2022(09):3180-3194
A类:
SLDR,台标检测和识别
B类:
数据合成,度量学习,检测与识别,语义信息,信息量,背景干扰,泛化能力,标图,图像叠加,背景图,训练数据集,两阶段,可伸缩,scalable,logo,detection,recognition,batch,hard,快速训练,匹配模型,分离机,知类,合成数据,检测精度,检测模型,端到端模型
AB值:
0.394243
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。