典型文献
非均衡数据分类经典方法综述与面向医疗领域的实验分析
文献摘要:
近年来,人工智能技术被广泛地应用于多个领域.其中,智慧医疗场景得到了普遍关注,并产生了大量临床辅助诊断和医疗方案推荐的实际应用.然而,由于人工智能技术的本质在于通过从大量真实数据中进行模式抽取,从而预测未知情况,因此真实数据的数据特征和数据质量将直接影响人工智能应用的效果.相比其他智能应用领域,由于罕见病患者在人群中总是占极少数,医疗数据具有天然的非均衡的特点,而高度非均衡的数据在机器学习领域被认为是难于学习的.针对这一应用现状,文中首先围绕"数据非均衡"问题开展了文献调研,尝试通过寻找该问题的通用解决办法来指导在智慧医疗环境下的应用.之后,以数据挖掘领域的会议SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)近年来涉及非均衡数据集的工作为分析样本,统计针对特定领域的"数据非均衡"问题人们倾向选择的处理方法.最后,通过医学数据分析中的两个典型应用场景,对调研获得的知识和方法进行实验应用,从而验证了调研和统计分析中所得出方法的可用性.
文献关键词:
数据分析;智慧医疗;非均衡数据集;过采样
中图分类号:
作者姓名:
江昊琛;魏子麒;刘璘;陈俊
作者机构:
清华大学软件学院 北京信息科学与技术国家研究中心 北京 100084;百度公司 北京 100094
文献出处:
引用格式:
[1]江昊琛;魏子麒;刘璘;陈俊-.非均衡数据分类经典方法综述与面向医疗领域的实验分析)[J].计算机科学,2022(01):80-88
A类:
SIGKDD
B类:
数据分类,类经,经典方法,方法综述,医疗领域,智慧医疗,医疗场景,临床辅助,辅助诊断,方案推荐,技术的本质,真实数据,数据特征,数据质量,人工智能应用,罕见病患者,极少数,医疗数据,学习领域,难于,一应,文献调研,解决办法,医疗环境,ACM,Conference,Knowledge,Discovery,Data,Mining,非均衡数据集,特定领域,医学数据,典型应用场景,实验应用,可用性,过采样
AB值:
0.417748
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。