典型文献
基于图神经网络的百万数据人脸聚类
文献摘要:
人脸聚类是利用未标记人脸数据的重要工具,在人脸标注和检索等方面有着广泛的应用.如何有效地聚类,特别是在大规模(如百万级或以上)数据集上,是一个悬而未决的问题.最近的研究表明,基于图卷积神经网络(GCN)的聚类可以显著提高性能.然而这些方法需要生成大量的重叠子图,严重限制了模型的精度和效率.由于这些GCN算法没有分析过不同数据特征对模型的影响,通常仅在特定的数据集上表现出优异的性能.本文综合分析了距离、实例个数分布差异对模型的影响,提出了一种基于DBSCAN的图卷积网络模型.通过两段距离形成二次聚类模型,消除了 DBSCAN对距离的依赖,提高了模型精度,在多个数据集中最高提升了 20%;通过探索融合one-hot特征编码方式、多种邻接矩阵构图方法,进一步提升了模型的鲁棒性;通过邻接矩阵稀疏化算法解决了人群数量动态变化问题.在多个大型基准上的实验表明,相较于现有GCN算法,所提算法精度提高了 2%~7%,并降低了对硬件的要求,提升了运行效率,可以应用于百万级的人脸聚类场景.
文献关键词:
K近邻;图卷积神经网络;人脸聚类;邻接矩阵;稀疏矩阵
中图分类号:
作者姓名:
何川;侯进;李金彪
作者机构:
西南交通大学计算机与人工智能学院,四川成都611756;西南交通大学综合交通大数据应用技术国家工程实验室,四川成都611756;西南交通大学信息科学与技术学院,四川成都611756
文献出处:
引用格式:
[1]何川;侯进;李金彪-.基于图神经网络的百万数据人脸聚类)[J].微电子学与计算机,2022(07):24-35
A类:
B类:
图神经网络,百万,万数,人脸聚类,或以,悬而未决,图卷积神经网络,GCN,子图,数据特征,分布差异,DBSCAN,图卷积网络,两段,段距离,二次聚类,聚类模型,模型精度,one,hot,特征编码,编码方式,邻接矩阵,构图,稀疏化,数量动态,近邻,稀疏矩阵
AB值:
0.338902
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。