首站-论文投稿智能助手
典型文献
潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究
文献摘要:
厘清当前阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态是进一步探讨AI训练数据治理的基础与前提.本研究在扎根理论的指导下,以滚雪球抽样法获得的100位AI开发者为研究对象,通过半结构化访谈结合非正式沟通、现实观察、内部与公开资料搜集等方式获取研究数据并提炼概念与范畴,勾勒出现阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态,主要结论包括:(1)AI开发者群体将经由自行采集、公开数据、爬取数据、第三方购买与模拟产生等不同渠道获取的人工智能训练数据用于数据标注、算法验证等常规用途,但存在猎奇分享、窥探心理等异化用途;(2)AI开发者群体对数据使用边界的心理认知主要包括数据泄露/冒用作假、隐私贩卖/侥幸心理、算法偏见/个人主观、干扰社会事务及心理伤害;(3)个人道德、协议约束、法律担忧与媒介监督等因素警示AI开发者对于数据边界问题保持清醒与冷静;(4)将法律、监管、媒体等哲社制衡方案嵌入到AI开发者的数据来源渠道及操作使用层面,进而寻求创新与伦理间的平衡已成为AI数据治理的关键.
文献关键词:
人工智能;训练数据;数据来源;使用情态;数据治理
作者姓名:
高泽晋
作者机构:
清华大学新闻与传播学院
文献出处:
引用格式:
[1]高泽晋-.潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究)[J].新闻记者,2022(01):86-96
A类:
B类:
潘多拉,魔盒,智能训练,训练数据,开发者,扎根研究,端口,使用情态,数据治理,扎根理论,滚雪球抽样,抽样法,过半,半结构化访谈,非正式,资料搜集,研究数据,概念与范畴,勾勒,爬取,数据标注,算法验证,猎奇,窥探,化用,数据使用,心理认知,数据泄露,冒用,作假,私贩,贩卖,侥幸心理,算法偏见,个人道德,担忧,警示,边界问题,清醒,冷静,制衡,数据来源,操作使用
AB值:
0.416756
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。