首站-论文投稿智能助手
典型文献
基于聚类分析的数据文件格式分析方法
文献摘要:
在实际工作中经常需要进行文件格式分析,以方便数据资源共享与交换,而 目前数据文件格式分析方法存在解析效率低下等问题.为此提出基于聚类分析的数据文件格式分析方法,该方法应用聚类思想,通过同类型不同文件同一字节位置的聚类、文件组内不同字节位置的聚类,获得数据文件字节重复度分布并分析相应的聚类分布特征;将数据文件的文件头部分、文件数据体部分及分界处的重复度分布特征作为文件格式分析的依据,并提出以字节组聚类分析的方法提升文件格式分析效率.基于文件存储结构和聚类分布特征,制定了聚类分析的文件样本选取原则;同时开发了相应的格式解析辅助工具软件,该软件能自动进行选定文件合理性判断、自动分组等,简化了相应的格式解析处理过程.应用该方法和开发的工具进行了型号为Agilent GC 6890N MSD 5793N的质谱仪产生的MS数据文件格式解析试验,实验结果表明,该方法分析得到的文件格式准确、效率明显提高,通过对该方法复用,可以有效促进大型科研仪器数据资源共享,提高数据资源利用率.
文献关键词:
聚类分析;仪器资源共享;数据文件格式分析
作者姓名:
刘杰;常兴山;孙锋;周建辉
作者机构:
武汉理工大学船海与能源动力工程学院,武汉430063;中国舰船研究设计中心,武汉430064
引用格式:
[1]刘杰;常兴山;孙锋;周建辉-.基于聚类分析的数据文件格式分析方法)[J].武汉理工大学学报,2022(01):93-99
A类:
数据文件格式分析,6890N,5793N,仪器资源共享
B类:
以方,数据资源共享,解析效率,一字,字节,节位,得数,文件头,件数,分界,分析效率,文件存储,存储结构,样本选取,选取原则,格式解析,辅助工具,工具软件,该软件,理性判断,Agilent,MSD,质谱仪,复用,大型科研仪器,资源利用率
AB值:
0.246214
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。