典型文献
DMFUCP:大规模轨迹数据通用伴随模式分布式挖掘框架
文献摘要:
广泛应用的移动定位设备方便了用户位置数据的获取,轨迹数据量高速增长.通用伴随模式挖掘聚焦时空维度上的用户高相似度行为路径发现问题,基于大规模轨迹数据设计高效准确地伴随模式挖掘方法对发现用户偏好、构建新商业模式等具有重要意义,同时也极具挑战.一方面,海量且不断增长的轨迹数据要求伴随模式挖掘应具有良好的可扩展性,集中性挖掘策略并不适用.另一方面,现有的分布式挖掘框架在为高效模式挖掘提供高质量数据输入、轨迹数据中大量松散连接的有效处理等方面考虑不足,使得通用伴随模式发现存在改进空间.提出了一个分布式的2阶段通用伴随模式挖掘框架——DMFUCP,其通过嵌入数据预处理优化、松散连接分析优化等,让伴随模式挖掘方法呈现了更好的性能.其中,该框架为数据预处理阶段设了融合运动方向的密度聚类算法DBSCANCD和聚类平衡算法TCB,确保后续挖掘任务获得提供少噪音、高质量的轨迹数据输入;在模式挖掘阶段,该框架设计了G剪枝重划分算法GSPR和分段枚举算法SAE,GSPR使用参数G对长轨迹进行分割,并将分割后的所有分段重划分以改善松散连接的处理效果,SAE负责引入多线程和前向闭包保证挖掘算法的性能.实验证明,相比现有的通用伴随模式挖掘框架,DMFUCP具有更好的通用伴随模式发现能力的同时,将挖掘每组通用伴随模式的时间消耗降低了20%~40%.
文献关键词:
分布式挖掘框架;松散连接;聚类平衡;G剪枝重划分;分段枚举
中图分类号:
作者姓名:
张敬伟;刘绍建;杨青;周娅
作者机构:
广西可信软件重点实验室(桂林电子科技大学)广西桂林 541004;广西自动检测技术与仪器重点实验室(桂林电子科技大学)广西桂林 541004
文献出处:
引用格式:
[1]张敬伟;刘绍建;杨青;周娅-.DMFUCP:大规模轨迹数据通用伴随模式分布式挖掘框架)[J].计算机研究与发展,2022(03):647-660
A类:
DMFUCP,分布式挖掘框架,松散连接,DBSCANCD,聚类平衡,GSPR,分段枚举
B类:
轨迹数据,数据通,伴随模式,移动定位,定位设备,用户位置,位置数据,数据量,高速增长,模式挖掘,时空维度,行为路径,发现问题,数据设计,挖掘方法,现用,用户偏好,新商业模式,可扩展性,集中性,挖掘策略,高效模式,质量数据,改进空间,数据预处理,分析优化,合运动,密度聚类算法,TCB,噪音,框架设计,剪枝,重划,划分算法,枚举算法,SAE,处理效果,多线程,闭包,挖掘算法
AB值:
0.260891
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。