首站-论文投稿智能助手
典型文献
面向数字文旅的图像文本跨模态检索方法
文献摘要:
[目的/意义]图像文本跨模态检索应用对最大化利用数字文旅资源具有重要意义.然而,数字文旅领域的图像文本跨模态检索方法面临长文本挑战、数据缺失、内存资源有限等问题.为此,我们提出了一种新的基于Transformers和MobileNet V3模型的数字文旅图像文本跨模态方法.[方法/过程]首先,提出了基于自注意力机制的双层多组Transformers模型从标题、正文和评论等文本中学习具有互补性的文本特征;其次,设计了 FastR-CNN和MobileNet V3模型学习图像局部细粒度特征;最后,提出了多元线性回归方法在共享子空间补全缺失数据.构建以图搜文和以文搜图的双向三元损失函数学习模型参数.[结果/结论]在标准数据集Flickr30k、自建数据集CulTour-Sha和有数据缺失的数据集Flickr30k-1与CulTour-Sha-1上的大量实验结果表明,我们的方法在召回率、内存需求和计算速度等方面优于当前几种先进的跨模态检索方法.
文献关键词:
数字文旅;跨模态检索;深度学习特征;双向三元组损失函数;精细特征
作者姓名:
高蕴梅
作者机构:
常熟理工学院图书馆 江苏 215500
文献出处:
引用格式:
[1]高蕴梅-.面向数字文旅的图像文本跨模态检索方法)[J].情报资料工作,2022(01):71-80
A类:
FastR,共享子空间,子空间补,CulTour,Sha,双向三元组损失函数
B类:
数字文旅,跨模态检索,检索方法,文旅资源,长文,数据缺失,Transformers,MobileNet,V3,自注意力机制,标题,正文,文和,互补性,文本特征,模型学习,细粒度特征,补全,缺失数据,以图,三元损失函数,函数学习,标准数据集,Flickr30k,自建数据集,召回率,计算速度,深度学习特征,精细特征
AB值:
0.266103
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。