典型文献
基于hadoop平台的数据挖掘算法实证研究
文献摘要:
在数据挖掘过程中,由于决策树在分析阶段存在单一递进关系,会导致数据的分析效率不高.针对这一问题,文章提出了基于hadoop平台的数据挖掘算法,并展开了相关实证研究.首先,采用广度优先策略对数据集挖掘算法决策树展开设计,将节点之间的最小加权欧氏距离作为划分基准,利用hadoop平台中的MapReduce程序实现对决策树节点分枝操作的并行处理,以此建立决策树的层级关系,实现对待处理数据集的逐层分析.然后,对数据挖掘算法的Map函数展开设计,以待分析数据键值对与分类基准参量之间的关系实现对数据的分类挖掘.测试结果表明,该算法的运算效率和加速比均处于较高的水平,能够满足海量数据的处理需求.
文献关键词:
hadoop平台;数据挖掘算法;实证研究
中图分类号:
作者姓名:
高飞
作者机构:
广西现代职业技术学院,广西 河池 547000
文献出处:
引用格式:
[1]高飞-.基于hadoop平台的数据挖掘算法实证研究)[J].广西广播电视大学学报,2022(06):24-28
A类:
B类:
hadoop,数据挖掘算法,决策树,分析阶段,进关,分析效率,效率不高,广度优先,算法决策,加权欧氏距离,MapReduce,程序实现,对决,树节,分枝,并行处理,立决,层级关系,待处理,逐层,以待,key,value,键值对,参量,分类挖掘,运算效率,加速比,海量数据
AB值:
0.429895
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。