首站-论文投稿智能助手
典型文献
基于社交媒体文本的灾情信息识别方法比较研究
文献摘要:
挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体灾情文本主题初步识别,可以为后续工作提供优化,进而为相关部门采取应急措施提供参考.
文献关键词:
社交媒体;数据挖掘;灾情文本;主题识别;机器学习;精度评价
作者姓名:
王月明;胡卓玮;陈锡
作者机构:
首都师范大学资源环境与旅游学院,北京100048;资源环境与地理信息系统北京市重点实验室,北京100048
文献出处:
引用格式:
[1]王月明;胡卓玮;陈锡-.基于社交媒体文本的灾情信息识别方法比较研究)[J].自然灾害学报,2022(01):179-187
A类:
灾情文本
B类:
社交媒体,灾情信息,信息识别,方法比较,自然灾害事件,微博文本,文本数据,集为,语料,朴素贝叶斯,逻辑回归算法,主题识别,多元逻辑回归模型,精度评价,指标值,题类,情感支持,提醒,错分,内因,参数设置,切分,外因,样本量,模型应用,文本主题,后续工作,应急措施
AB值:
0.289647
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。