一种基于分割K-最近邻算法的传染病预测方法

传染病预测是时间序列预测中的一个重要应用领域,针对常用传染病预测算法准确率较低的问题,提出一种基于数据分割的最近邻算法,对相同月份的数据进行相似度计算。将传染病数据按照月份进行分割,得到不同年份、相同月份的时间序列数据,运用K-最近邻(KNN)的方法对时间序列数据进行相似度计算,得出最相似的时间序列的预测序列预测值。利用上海市疾病预防控制中心腹泻数据进行实验,结果表明,该方法能够充分考虑到月份对腹泻人数的影响,与改进前的基于KNN的连续时间序列预测算法相比,平均绝对误差值、平均百分比误差值、均方根误差值分别降低38.52,0.07,47.86,与传统的预测方法 ARIMA相比,平均绝对误差、平均百分比误差值、均方根误差值分别降低23.04,0.07,28.12。

上海市国际科技合作基金资助项目(13430710100); 上海市科委科技创新行动计划基金资助项目(13511506201);

预测; 传染病预测; K-最近邻算法; 时间序列; 相似性计算;

O211.61

计算机工程

Computer Engineering

2016年01期

ISSN:1000-3428

中文核心期刊

189163-1675161K
在线咨询 用户反馈