典型文献
基于Python的新浪微博中爬虫程序维护方法
文献摘要:
新浪微博是当下社会使用较广泛的社交平台,为了提高平台的稳定运行能力,给予用户更加良好的社交体验,提出基于Python的新浪微博中爬虫程序维护方法.按照标准的统计方法与机器学习模式,在爬虫程序中建立空间场景,当识别到的爬虫程序信息与网站域名信息具备一定适配性时,爬虫程序维护信息.同时,抓取爬虫程序中敏感数据,按照网站浏览顺序进行匹配,以此获取的节点数据作为程序维护的依据;并采用建立目标函数的方式,对敏感数据有效性的校验,从维护合理性角度出发,参照域名地址,定位敏感数据发生位置,以此完成对程序的维护.实验结果表明:提出的爬虫程序维护方法,可提高对爬虫程序获取敏感数据定位的准确率,实现对网站爬虫程序的维护.
文献关键词:
Python;新浪微博;爬虫程序;维护方法
中图分类号:
作者姓名:
何波
作者机构:
中国民用航空飞行学院绵阳分院,四川绵阳 621000
文献出处:
引用格式:
[1]何波-.基于Python的新浪微博中爬虫程序维护方法)[J].软件,2022(02):52-54
A类:
B类:
Python,新浪微博,爬虫程序,维护方法,社会使用,社交平台,高平,运行能力,社交体验,统计方法,学习模式,空间场景,站域,域名,适配性,抓取,敏感数据,浏览,数据有效性,校验,名地,地址
AB值:
0.288627
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。