典型文献
基于ADASYN-LOF-RF模型的核心专利识别研究
文献摘要:
目的:针对传统核心专利识别方法处理不平衡数据效果欠佳,和识别准确率低的问题,特重构指标体系,提出重采样与集成算法的组合模型.方法:首先,在传统专利指标的基础上,增加专利发明人指标;其次,采用自适应采样算法ADASYN增加少数类样本以解决不平衡问题,使用局部离群因子LOF对采样后的样本进行降噪,并与随机森林RF组合,形成ADASYN-LOF-RF模型;最后,对智慧芽平台中2012—2016年22077条光伏专利进行分类预测.结果:ADASYN-LOF-RF的准确率A均值为92.28%、召回率R均值为98.04%,优于SVM、RF、ADASYN-RF模型.结论:本组合模型具有很好的分类性能,能够有效识别出核心专利.
文献关键词:
核心专利识别;机器学习;组合模型
中图分类号:
作者姓名:
李颖;吴增源;陈亮
作者机构:
中国计量大学经济与管理学院,浙江杭州310018;中国计量大学光学与电子科技学院,浙江杭州310018
文献出处:
引用格式:
[1]李颖;吴增源;陈亮-.基于ADASYN-LOF-RF模型的核心专利识别研究)[J].中国计量大学学报,2022(04):609-616
A类:
B类:
ADASYN,LOF,RF,核心专利识别,不平衡数据,识别准确率,特重,重采样,集成算法,组合模型,专利发明,发明人,自适应采样,采样算法,少数类,决不,不平衡问题,局部离群因子,降噪,智慧芽,分类预测,召回率,分类性能
AB值:
0.336438
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。