典型文献
使用多分类器的分布式模型重用技术
文献摘要:
传统的机器学习经常采用数据中心化的方式进行训练,然而由于实际应用中的传输开销或者隐私保护限制,数据越来越呈现分散化、隔离化的趋势.分布式训练学习技术为分散在信息孤岛上的数据融合提供了一种解决方案.然而,由于分散化数据本身具有天然异质性,本地数据分布经常是非独立同分布的(Non-IID),这给分布式训练带来了挑战.首先,为了应对单一模型难以适配所有异质客户端的难题,在分布式训练的基础上引入了模型重用技术,提出了分布式模型重用框架(DMR).然后,通过理论分析指出集成学习可以为异构数据提供有效的解决方案,并在此基础之上提出了使用多分类器的分布式模型重用技术(McDMR).最后,为了减少实际应用过程中的存储、计算和传输开销,继而提出了两种具体的优化方案:使用多头分类器的分布式模型重用(McDMR-MH)和使用随机分类器采样的分布式模型重用(McDMR-SC).在多个公开数据集上进行实验,实验结果验证了所提方法的有效性.
文献关键词:
学件;模型重用;多分类器;分布式学习;集成;效率;隐私保护
中图分类号:
作者姓名:
李新春;詹德川
作者机构:
南京大学 计算机科学与技术系,南京 210023;南京大学 计算机软件新技术国家重点实验室,南京 210023;南京大学 人工智能学院,南京 210023
文献出处:
引用格式:
[1]李新春;詹德川-.使用多分类器的分布式模型重用技术)[J].计算机科学与探索,2022(10):2310-2319
A类:
McDMR
B类:
多分类器,分布式模型,模型重用,数据中心,开销,隐私保护,分散化,离化,分布式训练,训练学,学习技术,信息孤岛,岛上,数据融合,数据分布,非独立同分布,Non,IID,客户端,集成学习,异构数据,多头,MH,SC,公开数据集,学件,分布式学习
AB值:
0.268283
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。