典型文献
基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法
文献摘要:
航空事故对航空安全起到至关重要的作用,影响航空安全的因素是多重的.文章对航空安全事故报告采用文本挖掘和R语言,找出航空安全事故的致险因素,对航空安全提供参考,收集事故报告90例,首先采用了结巴分词对数据进行分词处理,其次是过滤分词结果中的停用词和无效词,然后进行关键字的提取,找出能够代表文本特征的词条,建立向量空间模型,最后采用K-means聚类算法,在K值为3时聚类效果达到最佳,将航空事故致险因素分为了人为-环境-设备三类,利用R语言的Word Cloud程序包将实验结果进行可视化处理,得出8项主要致险因素,17项一般致险因素.根据词云图中的致险因素,从人-环境-设备三个方面为以后的飞行安全提供了有价值的参考信息.
文献关键词:
航空安全事故报告;文本挖掘;分词;聚类;致险因素
中图分类号:
作者姓名:
马婷
作者机构:
中国民用航空飞行学院计算机学院,四川广汉618307
文献出处:
引用格式:
[1]马婷-.基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法)[J].电脑知识与技术,2022(35):56-59,72
A类:
航空安全事故报告,结巴分词
B类:
文本挖掘,means,可视化分析方法,航空事故,出航,致险因素,词处理,停用,用词,关键字,表文,文本特征,词条,向量空间模型,聚类算法,达到最佳,Word,Cloud,程序包,可视化处理,词云图,飞行安全,考信
AB值:
0.268824
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。