典型文献
基于影响度的统计显著序列模式挖掘算法
文献摘要:
针对传统序列模式挖掘算法中支持度不能如实体现序列模式兴趣度以及未对报告的序列模式进行质量评估的问题,提出一个基于影响度的统计显著序列模式挖掘算法ISSPM.首先,递归地挖掘出所有满足兴趣度约束的序列模式;然后,使用项集置换方法构建这些序列模式的置换检验零分布;最后,通过该零分布计算出被评估的序列模式的统计度量值,并从上述序列模式中找到所有统计显著序列模式.真实序列记录集合上的实验结果表明,ISSPM算法相较于PSPM、SPDL和PSDSP算法挖掘到的序列模式数量更少但兴趣度更强;仿真序列记录集合上的实验结果表明,ISSPM算法报告的结果中假阳性序列模式数量平均占比为3.39%,且该算法的嵌入模式的发现率均不低于66.7%,明显优于上述3个对比算法.可见,ISSPM算法报告的统计显著序列模式能够体现序列记录集合中更有价值的信息,同时根据这些信息做出的进一步分析和决策也更加可靠.
文献关键词:
数据挖掘;序列模式挖掘;兴趣度度量;统计显著模式;置换检验
中图分类号:
作者姓名:
吴军;欧阳艾嘉;张琳
作者机构:
遵义师范学院信息工程学院,贵州遵义563006
文献出处:
引用格式:
[1]吴军;欧阳艾嘉;张琳-.基于影响度的统计显著序列模式挖掘算法)[J].计算机应用,2022(09):2713-2721
A类:
ISSPM,PSPM,SPDL,PSDSP,兴趣度度量,统计显著模式
B类:
影响度,序列模式挖掘,挖掘算法,统序,中支,支持度,如实,质量评估,递归,挖掘出,集置,置换检验,零分,分布计算,被评,列记,记录集,假阳性,嵌入模式,发现率,对比算法,分析和决策
AB值:
0.215334
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。