首站-论文投稿智能助手
典型文献
一种中文文档解析与编码识别系统
文献摘要:
本论文为促进工作的信息化、自动化,设计了一个文档解析系统.其核心功能是读取并解析规程文档的内容,并且识别出文档中存在的设备编码,从而将规程文档中有价值的信息提炼出来以便工作人员能够更有效地利用或者更快速地检索需要的规程文档.本论文提出的编码识别系统基于正则表达式和支持向量机技术.正则表达式用于提取文档中的疑似编码,利用支持向量机训练了一个二分类器用于判断疑似编码是否为真正的编码.研究结果表明该系统可以有效的地用于工程实践中,具有很高的可用性,能够大大提高工作人员的工作效率.
文献关键词:
文档解析;编码识别;支持向量机;正则表达式;短文本分类
作者姓名:
姚昊
作者机构:
中核核电运行管理有限公司,浙江 嘉兴 314000
文献出处:
引用格式:
[1]姚昊-.一种中文文档解析与编码识别系统)[J].科技视界,2022(30):15-19
A类:
文档解析
B类:
编码识别,识别系统,本论,核心功能,读取,程文,信息提炼,正则表达式,支持向量机技术,二分类,分类器,器用,可用性,短文本分类
AB值:
0.211909
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。