典型文献
基于LDA和优化蚁群的OD流向时空语义聚类算法
文献摘要:
针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(La-tent Dirichlet Allocation,LDA)和优化蚁群的 OD 流向语义聚类算法.算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主题模型提取流向语义,量化OD流向间的语义相似度,融合时间、空间和语义相似度构建流向时空语义相似度;接着以流向为节点,以流向时空语义相似度为边构建流向图,利用高斯函数映射以及图连通分量,剔除不相似的流向,实现数据精简;之后借鉴了密度峰值聚类算法思想,利用节点的介数中心性优化蚁群初始位置选取;最后基于多路切图准则(Multiway Normalized Cut,MNCUT)强化蚁群搜索的目的性,优化蚁群搜索的聚类效果,实现OD流向的时空语义聚类.以厦门市出租车公开数据集与厦门市高德地图POI数据为例进行分析与验证,结果表明本文基于LDA模型的语义提取方法可以有效提取流向的语义信息,构建有效的流向相似度度量;基于高斯函数和图连通分量特性的映射策略可以有效剔除了流向数据中的噪音,有效节省无向图构建的计算开支,大约节省了 88.5%~88.8%的运行时间;基于介数中心性和多路切图准则优化的蚁群搜索聚类算法,可以有效进行流向语义聚类.相比已有方法本文方法能够更好地衡量流向间的语义相似程度,可实现按主题进行聚类划分,划分更加精细,更方便有效地进行流向语义的相关分析.
文献关键词:
OD流向;地理信息;数据挖掘;时空语义聚类;LDA;流向语义相似度;蚁群算法;移动模式
中图分类号:
作者姓名:
张晗;邬群勇
作者机构:
福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;卫星空间信息技术综合应用国家地方联合工程研究中心,福州350108;福州大学数字中国研究院(福建),福州350003
文献出处:
引用格式:
[1]张晗;邬群勇-.基于LDA和优化蚁群的OD流向时空语义聚类算法)[J].地球信息科学学报,2022(05):837-850
A类:
时空语义聚类,Multiway,MNCUT,流向语义相似度
B类:
LDA,OD,语义信息,语义提取,隐含狄利克雷分布,分布模型,La,tent,Dirichlet,Allocation,先以,POI,文档,主题模型,流向图,高斯函数,函数映射,连通分量,精简,密度峰值聚类算法,法思想,介数中心性,初始位置,多路,Normalized,Cut,目的性,厦门市,出租车,公开数据集,高德地图,有效提取,相似度度量,噪音,开支,运行时间,相似程度,地理信息,蚁群算法,移动模式
AB值:
0.259658
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。