首站-论文投稿智能助手
典型文献
一种基于Context Graph主题爬虫系统的算法实现
文献摘要:
对搜索引擎的原理结构进行深度剖析,经可行性认定后,将机器学习算法与现有的技术手段进一步融合提升,以Python为开发平台,以Context Graph为开发主题,构建并设计出可实现的目标爬虫系统.通过实际运用检测系统的实用性能,选择国内具有较大规模的汽车网站为研究对象,设置"汽车"为关键词对全部内容展开不同类别的爬取,进而分析所得结果,根据查全率、查准率和F1值综合评价系统的性能.与原有系统相比,升级后算法的模型准确性更好,在一定程度上提高爬取工作的效率.
文献关键词:
搜索引擎;主题爬虫;文本分析;机器学习
作者姓名:
高庆芳;蒲宝卿;包蕾
作者机构:
陇南师范高等专科学校 数信学院,甘肃 陇南 742500
引用格式:
[1]高庆芳;蒲宝卿;包蕾-.一种基于Context Graph主题爬虫系统的算法实现)[J].兰州文理学院学报(自然科学版),2022(06):41-45
A类:
B类:
Context,Graph,主题爬虫,算法实现,搜索引擎,深度剖析,机器学习算法,融合提升,Python,开发平台,实际运用,汽车网,全部内容,爬取,据查,查全率,查准率,综合评价系统
AB值:
0.43673
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。