要找到一个合适的模型来预测时间序列数据总是很困难。其中一个原因是,使用时间序列数据的模型往往会暴露出序列相关性。
在这篇文章中,我们将比较
-
经典的随机过程--自回归移动平均(ARIMA)。
-
k近邻(KNN)回归(一种有监督的机器学习方法)
1991年至2008年澳大利亚每月的抗糖尿病药物补贴。
作为药品福利计划的一部分,澳大利亚健康保险委员会记录的属于ATC代码A10的产品的每月政府支出(百万美元)。
-
时间:1991年7月至2008年6月。
-
格式:ts类别的月度时间序列。
library(fpp2)
data("a10")
2平滑化和季节性分解时序数据
对时序数据建立复杂模型之前也需要对其进行描述和可视化。在本节中,我们将对时序进行平滑化以探究其总体趋势,并对其进行分解以观察时序中是否存在季节性因素。
-
简单观察数据是否存在季节性
# 可视化包 library(ggplot2) # 拼图工具包 library(patchwork) autoplot(a10) + ggseasonplot(a10)



