首站-论文投稿智能助手
典型文献
概率式关联可信中文知识图谱——"文脉"
文献摘要:
国内现有的中文知识图谱往往以维基百科、百度百科等群体智能贡献的知识库作为资源抽取得到,但这些知识图谱利用的主要是百科的实体名片信息和分类体系信息.然而,这些百科中也有大量的内部链接信息,其中蕴含了大量知识.故而该文中利用维基百科的内部链接构造边,并统计目标实体在源实体定义文本中出现的频度,利用其对应的T F-ID F值作为边权,构造了一个概率式中文知识图谱.该文还提出了一种可信链接筛选算法,对偶发链接进行了去除,使知识图谱更加可信.基于上述方法,该文挖掘出了一个概率式关联可信中文知识图谱,命名为"文脉",将其在GitHub上进行了开源,以期能对知识指导的自然语言处理以及其他下游任务有所襄助.
文献关键词:
维基百科;知识图谱构建;可信链接筛选
作者姓名:
李文浩;刘文长;孙茂松;矣晓沅
作者机构:
清华大学计算机科学与技术系,北京 100084;清华大学人工智能研究院,北京 100084;北京信息科学与技术国家研究中心,北京100084;加州大学戴维斯分校计算机科学系,加利福尼亚州95616;江苏高校语言能力协同创新中心,江苏徐州221009;微软亚洲研究院,北京 100080
文献出处:
引用格式:
[1]李文浩;刘文长;孙茂松;矣晓沅-.概率式关联可信中文知识图谱——"文脉")[J].中文信息学报,2022(12):67-73
A类:
可信链接筛选
B类:
文脉,维基百科,百度,群体智能,知识库,名片,分类体系,故而,频度,ID,边权,筛选算法,对偶,偶发,接进,挖掘出,GitHub,开源,自然语言处理,襄助,知识图谱构建
AB值:
0.28555
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。