首站-论文投稿智能助手
典型文献
基于时空相关性的公交大数据清洗
文献摘要:
随着大数据与AI技术的发展,由数据驱动的预测模型层出不穷,数据清洗在提升这些模型预测中起着重要的作用.从公交车运行数据的时空相关性入手,分析了公交大数据存在的四类异常,接着在对时间相关性、空间邻近性、时空依赖性等公交大数据特性的分析基础上,提出了整合缓冲区、四分位数、时间依赖网络等时空处理方法的冗余清洗、范围清洗、异常清洗、补全清洗四种清洗方法,然后对公交进出站、轨迹数据集用这几种清洗方法进行了清洗.在不同清洗数据集下,通过LSTM公交到达时间预测精度的比较分析,证明了数据清洗对预测精度的提升是显著的.
文献关键词:
数据清洗;时空相关性;数据质量;公交大数据
作者姓名:
谢智颖;何原荣;李清泉
作者机构:
厦门理工学院 计算机与信息工程学院,福建 厦门 361024;深圳大学 空间信息智能感知与服务深圳市重点实验室,广东 深圳 518060
引用格式:
[1]谢智颖;何原荣;李清泉-.基于时空相关性的公交大数据清洗)[J].计算机工程与应用,2022(01):113-121
A类:
B类:
时空相关性,公交大数据,数据清洗,公交车,车运,运行数据,四类,时间相关性,空间邻近性,时空依赖性,缓冲区,四分位数,时间依赖,依赖网络,空处,补全,清洗方法,交进,进出站,轨迹数据,清洗数据,交到,到达时间,时间预测,数据质量
AB值:
0.33428
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。