典型文献
面向过程挖掘的日志划分技术综述
文献摘要:
过程挖掘的目标是从软件系统产生的日志数据中提取出有价值信息,用于配置或优化已实施的业务过程.与此同时,大数据、物联网等技术的发展不仅使得业务内容愈加复杂,更是加速了业务演化的速度.在此背景下,有必要对原始日志进行划分,使得事件日志通过分解而被更有效地分析,进而提升过程挖掘的质量.日志划分的宗旨是根据不同问题采取不同方法将原始事件日志划分为多个子日志,为后续的过程挖掘研究提供支撑.模型发现是过程挖掘中最重要的应用场景,而该场景面临的两大难题就是模型过于复杂和模型不正确.当前,解决这两个难题的方法分别是轨迹聚类和概念漂移,而这两类方法的本质都是对原始事件日志进行了划分.本文针对轨迹聚类和概念漂移两个分支进行归纳总结,试图厘清日志划分内容中这两个分支的异同点.接着,通过文献规约系统地对现有研究进行统计与分析,揭露了两个研究分支的发展趋势.然后,梳理了现有研究方法的主要思路,将轨迹聚类分为距离驱动、模型驱动和混合聚类三类,并将概念漂移分为单一类型和复合类型两类.最后,利用公开数据集测试不同类型算法的优缺点,并指出未来研究的发展方向.
文献关键词:
过程挖掘;轨迹聚类;概念漂移;业务演化
中图分类号:
作者姓名:
林雷蕾;闻立杰;钱忱;宗瓒;王建民
作者机构:
清华大学软件学院 北京 100084;工业大数据系统与应用北京市重点实验室 北京 100084
文献出处:
引用格式:
[1]林雷蕾;闻立杰;钱忱;宗瓒;王建民-.面向过程挖掘的日志划分技术综述)[J].计算机学报,2022(09):1946-1968
A类:
业务演化
B类:
过程挖掘,技术综述,软件系统,日志数据,价值信息,业务过程,事件日志,升过,不同方法,模型发现,不正确,轨迹聚类,概念漂移,方法的本质,分内,异同点,规约,统计与分析,揭露,主要思路,模型驱动,混合聚类,公开数据集
AB值:
0.277086
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。