首站-论文投稿智能助手
典型文献
一种高效的相似性度量方法及其分类效果研究
文献摘要:
高维数据分类在统计分析中具有重要意义.然而分类方法由于所依赖的度量距离仍面临噪声敏感性强、计算量大及精度低等问题而导致分类效果不佳.针对高维时序相似性度量的精度及效率的不足,基于欧式距离提出一种改进的相似性度量方法并用于提升分类效果.首先,采用离散小波变换(DWT)对序列进行分解重构,提出局部高频DWT方法以达到降维消噪的目的.然后,在距离函数的基础上结合波幅和秩相关系数的概念,从相对偏差与波动趋势一致性角度进行改进.采用1-最近邻技术(1-NN),比较所提方法与动态时间规整(DTW)、FastDTW、最长公共子序列(LCSS)度量方法的性能.基于40个UCR时间序列数据集的实验结果表明,相对于DTW,FastDTW,LCSS度量方法,所提方法下的1-NN分类准确率更具有优越性,置信度不低于85%,同时证实了所提相似性搜索方法在准确率及速度上均得到显著改善.该结论丰富了相似性度量理论基础,对数据挖掘技术在智能系统管理、时间序列统计上的应用具有重要的参考价值.
文献关键词:
时间序列分析;相似性度量;离散小波变换;K-NN分类;数据挖掘
作者姓名:
袁慧;谭章禄;王福浩
作者机构:
中国矿业大学(北京)管理学院,北京100083;华北电力大学控制与计算机工程学院,北京102206
引用格式:
[1]袁慧;谭章禄;王福浩-.一种高效的相似性度量方法及其分类效果研究)[J].中国科学(技术科学),2022(07):1096-1110
A类:
B类:
相似性度量,分类效果,高维数据,数据分类,分类方法,计算量,时序相似性,欧式距离,离散小波变换,DWT,分解重构,出局,消噪,距离函数,波幅,秩相关系数,数的概念,相对偏差,趋势一致性,最近邻,NN,动态时间规整,FastDTW,最长公共子序列,LCSS,UCR,时间序列数据,分类准确率,置信度,相似性搜索,搜索方法,数据挖掘技术,智能系统,系统管理,时间序列分析
AB值:
0.398226
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。