首站-论文投稿智能助手
典型文献
基于BERT的中文健康问句分类研究
文献摘要:
现有的医学健康问句数据大多数都是短文本,但短文本存在特征稀疏的局限性.对此,提出一种融合特征的方法,首先通过基于变换器的双向编码器表征技术(Bidirectional Encoder Representations from Transformers,BERT)字符级特征的输出取平均并与BERT句子级特征的输出进行拼接,然后使用分类器进行分类.实验结果表明,本模型可以有效地提高模型提取特征的能力,在处理Kesci公众健康问句分类数据集上F1值达到83.92%,在处理中文健康公众问句数据集时F1值达到87%.
文献关键词:
基于变换器的双向编码器表征(BERT);健康问句;字符级特征;句子级特征
作者姓名:
徐星昊
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650000
文献出处:
引用格式:
[1]徐星昊-.基于BERT的中文健康问句分类研究)[J].电视技术,2022(03):67-70
A类:
Kesci
B类:
BERT,健康问句,问句分类,分类研究,医学健康,句数,短文本,存在特征,特征稀疏,融合特征,变换器,双向编码器,表征技术,Bidirectional,Encoder,Representations,from,Transformers,字符级特征,取平,句子级特征,出进,拼接,分类器,提取特征,公众健康,分类数据
AB值:
0.402836
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。