典型文献
NEMTF:基于多维度文本特征的新闻网页信息提取方法
文献摘要:
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源.为此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作、语义和位置特征,通过多通道卷积神经网络融合为多维度文本特征,用于提取多种类新闻网页信息;仅需少量数据集训练,就可提取新来源的新闻网页信息.实验结果表明,该方法在性能上高于当前最优方法.
文献关键词:
网页信息提取;卷积神经网络;Web挖掘;文本特征
中图分类号:
作者姓名:
翁彬月;秦永彬;黄瑞章;任丽娜;田悦霖
作者机构:
贵州大学 计算机科学与技术学院,贵阳550025;贵州省公共大数据重点实验室,贵阳550025;贵州轻工职业技术学院,贵阳550025
文献出处:
引用格式:
[1]翁彬月;秦永彬;黄瑞章;任丽娜;田悦霖-.NEMTF:基于多维度文本特征的新闻网页信息提取方法)[J].计算机应用研究,2022(04):1043-1048
A类:
NEMTF,网页信息提取
B类:
文本特征,新闻网,提取信息,信息类型,新闻信息,HTML,不同来源,新闻文本,写作特点,分出,位置特征,多通道卷积神经网络,网络融合,少量数据,集训
AB值:
0.231554
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。