典型文献
基于机器学习的技术术语识别研究综述
文献摘要:
[目的]梳理机器学习算法在技术术语识别中的应用现状与前景.[文献范围]在WOS核心库和CNKI数据库中,以"technology term* recognition"、"技术术语识别"为检索词检索文献,并延伸阅读相关算法文献,共筛选62篇代表性文献进行述评.[方法]类比命名实体识别研究,归纳机器学习在技术术语识别中的应用和区别,从算法分类、一般流程、现存问题和下游应用4个方面进行梳理,并展望未来的应用前景.[结果]应用算法可分为单一的统计机器学习、单一深度学习和两者结合的混合算法,应用最广泛的是两者结合的混合算法,主流的模型代表是BiLSTM-CRF模型,迁移学习是未来重要的研究方向.[局限]深度学习快速发展,混合模型不断涌现,所归纳的算法模型仅为应用较为广泛的算法,并未逐一列出.[结论]现有方法仍然有诸多待优化研究的问题,应加强细粒度的实体识别、特征表示方法、评估方法和开源工具包等方面的研究.
文献关键词:
技术术语识别;机器学习;深度学习
中图分类号:
作者姓名:
胡雅敏;吴晓燕;陈方
作者机构:
中国科学院成都文献情报中心 成都610041;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190
文献出处:
引用格式:
[1]胡雅敏;吴晓燕;陈方-.基于机器学习的技术术语识别研究综述)[J].数据分析与知识发现,2022(02):7-17
A类:
技术术语识别
B类:
基于机器学习,梳理机,机器学习算法,WOS,核心库,technology,term,recognition,延伸阅读,法文,行述,命名实体识别,算法分类,一般流程,现存问题,展望未来,统计机器学习,混合算法,BiLSTM,CRF,迁移学习,混合模型,算法模型,一列,列出,待优,细粒度,特征表示,表示方法,开源,工具包
AB值:
0.327773
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。