首站-论文投稿智能助手
典型文献
基于偏相关性测试的递归式因果推断算法
文献摘要:
因果推断是挖掘事物间联系的一种重要方式,但在高维数据场景下,利用因果推断算法进行条件独立性(CI)测试存在冗余测试多和测试效率低的问题,这限制了因果推断在高维数据集上的应用.提出一种基于偏相关性测试的递归式因果推断算法.采用"分治"的方法对变量集进行递归式因果分割,得到更易于处理的低维子数据集,提高对数据集的处理效率.在每个子数据集上进行局部因果推断,减少每次因果推断的计算量并提升算法的运行速度.在此基础上,通过比较显著性值的合并策略整合所有子结果并得到完整的因果关系,保证总体因果结构的准确性.在"分治"过程中,采用高效的偏相关性测试避免高复杂度的核密度估算,进一步提升算法效率.基于10个经典数据集的实验结果表明,在准确率与经典推断算法CAPA持平的情况下,该算法的运算速度提升了2~10倍,且在样本量越大的数据集中提升效果越明显,证明递归式因果推断算法可以有效处理高维数据集,在保证准确率的同时提高运算效率.
文献关键词:
因果推断;因果网络;条件独立性测试;偏相关性测试;递归式算法
作者姓名:
陈铭杰;张浩;彭昱忠;谢峰;庞悦
作者机构:
东莞理工学院 计算机科学与技术学院,广东 东莞 523808;广东石油化工学院 计算机学院,广东 茂名 525099;复旦大学 计算机科学技术学院,上海 200433;南宁师范大学 计算机与信息工程学院,南宁 530001;北京大学 数学科学学院,北京 100871;中国银联博士后科研工作站,上海 201201
文献出处:
引用格式:
[1]陈铭杰;张浩;彭昱忠;谢峰;庞悦-.基于偏相关性测试的递归式因果推断算法)[J].计算机工程,2022(10):123-129
A类:
偏相关性测试,条件独立性测试,递归式算法
B类:
因果推断,高维数据,数据场,测试效率,分治,低维,处理效率,计算量,运行速度,比较显著,因果关系,因果结构,核密度估算,算法效率,CAPA,持平,样本量,提升效果,运算效率,因果网络
AB值:
0.216551
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。