基于改进文本表示的商品文本分类算法研究|屠振超;马静 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于改进文本表示的商品文本分类算法研究

文献摘要：

[目的]解决传统文本分类中分类器容易将属于不同标签但拥有许多相似修饰词的商品标题文本错误分类的问题,提高分类器的表现.[方法]本文设计了文本判别器作为辅助任务,其损失函数为不同标签文本向量的归一化欧氏距离,并结合传统文本分类主任务的交叉熵损失函数,推动文本编码器为不同类别的商品文本生成有足够区分度的文本表示,构建了 ITR-BiLSTM-Attention模型.[结果]对比没有使用文本判别器的BiLSTM-Attention基础模型,ITR-BiLSTM-Attention模型在准确率、精确率、召回率和F1值4个指标上分别提高1.84百分点、2.31百分点、2.88百分点、2.82百分点;对比文本判别器使用余弦相似度损失函数的Cos-BiLSTM-Attention模型,ITR-BiLSTM-Attention模型在4个指标上分别提高0.53百分点、0.54百分点、1.21百分点、1.01百分点.[局限]未测试不同采样方式对模型的影响,未在更广泛的数据集上进行实验.[结论]本文设计的文本判别器辅助任务确实能够改进文本编码器生成的文本表示;构建的基于改进文本表示的商品文本分类模型相比于传统的商品文本分类算法具有更好的表现.

文献关键词：

文本分类;文本表示;多任务学习;度量学习;商品分类

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

屠振超;马静

作者机构：

南京航空航天大学经济与管理学院南京211106

文献出处：

数据分析与知识发现

引用格式：

[1]屠振超;马静-.基于改进文本表示的商品文本分类算法研究)[J].数据分析与知识发现,2022(05):34-43

A类：

余弦相似度损失函数

B类：

文本表示,文本分类,分类算法,算法研究,分类器,修饰词,标题,误分类,判别器,辅助任务,文本向量,欧氏距离,交叉熵损失函数,文本编码,编码器,文本生成,区分度,ITR,BiLSTM,Attention,基础模型,精确率,召回率,百分点,Cos,采样方式,未在,分类模型,多任务学习,度量学习,商品分类

AB值：

0.264723

相似文献

标签指导的双注意力深度神经网络模型

彭展望;朱小飞;郭嘉丰-重庆理工大学计算机科学与工程学院重庆400054;中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190

结合层级注意力的抽取式新闻文本自动摘要

王红斌;金子铃;毛存礼-昆明理工大学信息工程与自动化学院,昆明 650500;昆明理工大学云南省人工智能重点实验室,昆明 650500

融合BERT与标签语义注意力的文本多标签分类方法

吕学强;彭郴;张乐;董志安;游新冬-网络文化与数字传播北京市重点实验室(北京信息科技大学),北京100101

基于层级多任务BERT的海关报关商品分类算法

阮启铭;过弋;郑楠;王业相-华东理工大学信息科学与工程学院,上海200237;大数据流通与交易技术国家工程实验室-商业智能与可视化技术研究中心,上海200436;上海大数据与互联网受众工程技术研究中心,上海200072

知识图谱增强的科普文本分类模型