首站-论文投稿智能助手
典型文献
Web信息增量采集与保存管理平台的设计与实现
文献摘要:
随着网络的普及和发展,互联网资源已经成为人类文明记忆的载体,及时并完整的保存网络信息资源变得尤为重要.文章结合国家图书馆网络信息资源采集与保存工作的发展历程、技术发展和互联网信息更新快等特点,提出基于Heritrix开源架构的网络信息增量采集与保存管理平台的设计和架构,并详细介绍平台在网络资源增量采集和增量回显一站式服务的实现技术,提升国家图书馆网络资源保存工作效率和服务质量的同时,以期为业界提供有益的参考和借鉴.
文献关键词:
Web信息抓取;增量采集;增量回显;Heritrix;平台构建
作者姓名:
赵丹阳
作者机构:
国家图书馆,北京 100081
文献出处:
引用格式:
[1]赵丹阳-.Web信息增量采集与保存管理平台的设计与实现)[J].无线互联科技,2022(23):68-71
A类:
增量采集,网络信息资源采集,Heritrix,增量回显
B类:
信息增量,互联网资源,国家图书馆,互联网信息,信息更新,更新快,开源,网络资源,一站式服务,资源保存,抓取,平台构建
AB值:
0.201139
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。