本文多是广泛的概念和SPSS运用,没有具体的推导过程和深入的探究
时间序列分析大致可以分成三大部分,分别是描述过去、分析规律和预测未来。
时间序列数据:对同一对象在不同时间连续观察所取得的数据。 例如:中国历年来的GDP数据,某一地方一天的温度数据…
时间序列也称为动态序列,是指某个现象的指标数值按照时间顺序排列而成的数值序列。
时间序列由两个组成要素构成: 1.第一要素是时间要素;年、季度、月、周、日、小时、分、秒… 2.第二要素是数值要素;
时间序列根据时间和数值性质的不同,可以分为时期时间序列和时点时间序列: 1.时期序列中,数值要素反映现象在一定时期内发展的结果;时期序列数值要素可以相加,且有意义,例如中国历年以来的的GDP… 2.时点序列中,数值要素反映现象在一定时间点上的瞬间水平。时点序列数值要素不可以相加,无意义,例如某地点一天时间的温度数据…
因为时间序列是某个指标数值的长期变化的数值表现,所以时间序列数值变化背后必然蕴含着数值变换的规律性,这些规律性就是时间序列分析的切入点。 一般情况下,时间序列的数值变化规律有四种:长期变动趋势、季节变动规律、周期变动规律和不规则变动(随机扰动项)。 一个时间序列往往是以上四类变化形式的叠加。
长期趋势:T 长期趋势指的是统计指标在相当长的一段时间内,受到长期趋势因素的影响,表现出持续上升或者持续下降的趋势;例如随着国家经济的发展,人均收入逐渐提升。季节趋势:S 季节趋势是指由于季节的转变使得指标指数发生周期性变动。这里的季节是广义的,一般以月、季、周为时间单位,不能以年为单位;例如雪糕和棉衣的销量随着季节气温的变化而周期性变化循环变动趋势:C 循环变动趋势与季节变动的周期不同,循环变动趋势通常以若干年为周期,在曲线图上表现为波浪式的周期变动。这种周期变动的特征表现为增加和减少交替出现,但是并不具严格规则的周期性连续波动。不规则变动趋势:I 不规则变动是由于某些随机因素导致的数值变化,这些因素的作用是不可预知和没有规律的,可以视为由于众多偶然因素对时间序列造成的影响(在回归中又被称为扰动项)(1)如果四种变动之间是相互独立的关系,那么叠加模型可以表示为: Y = T + S + C + I Y=T+S+C+I Y=T+S+C+I (2)如果四种变动之间存在相互影响关系,那么应该使用乘积模型: Y = T ∗ S ∗ C ∗ I Y=T*S*C*I Y=T∗S∗C∗I 注意: 数据具有周期性才能使用时间序列分解。 建议: 在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得很大,则反应各种变动之间的关系发生变化,建议使用乘积模型;反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型;当然,如果不存在季节波动,则两种分解均可以。
导入数据 — 转换 — 替换缺失值 — 右移相关变量 — 输入名称,选择方法 — 确定
导入数据 — 数据 — 定义日期和时间 — 选择适合的个案 — 输入第一个个案的信息 — 确定 重要!
导入数据 — 分析 — 时间序列预测 — 序列图 — 右移变量(即纵坐标)— 右移时间轴标签(即横坐标)— 选择性勾选“每个变量对应一个图表” — 选择性填写”时间线” — 确定 — 双击结果图,进行美化 — 在变量视图中更改变量名称,从而使得时序图中标注的改变
导入数据 — 分析 — 时间按序列预测 — 季节性分解 — 右移相关变量 — 选择乘性/加性 — 勾选移动平均值权重(奇数用“所有点相等”,偶数用“端点按0.5加权”)—确定 结果解读:
ERR_1代表不规则变动I(残差或者误差值);SAS_1代表季节性调整后系列(T+C+I);SAF_1代表季节性调整因子(S);STC_1代表趋势循环成分(T+C)。加性:季节因子和为0,每个周期的数值代表比平均值高或低的数值;乘性:季节因子乘为1,每个周期的数值代表是平均数值的倍数。分析 — 时间序列预测 — 创建传统模型 — 变量 — 右移因变量 — 条件 — 离群值 — 勾选自动检测离群值,勾选所有要检测的离群值类型(筛选异常值)— 统计 — 单个模型的统计 — 勾选参数估算值 — 图 — 勾选拟合值、残差相关系数和残差偏相关系数 — 保存 — 勾选预测值、置信区间的上限和下限 — 选项 — 勾选预测期结束后的第一个个案到指定日期之间的个案 — 输入想要预测到的日期
标注:
预测值和拟合值是不同的,预测值是将样本外年份的数据带入模型计算得到的,而拟合值是将样本年份的数据重新带入模型计算得到的。这里保存的残差ACF和PACF图形可以辅助判断断残值是否为白噪声,即该时间序列是否能被模型识别完全。一般比较两个模型的好坏,应当使用平稳的 R 2 R^2 R2,或者标准化BIC(BIC准则),这两个指标即考虑了拟合的好坏,又考虑了模型的复杂程度; R 2 R^2 R2可以用来反映线性模型拟合的好坏,越接近于1,拟合越准确。正态化BIC的结果越小,模型越合适。输出结果表格中,模型统计 — 杨·博克斯 — 显著性,这个数值大于0.05,则表示残差是白噪声,模型可以识别完全。利用ACF图和PACF图,可在论文中增添一句话:从残差的ACF和PACF图形可以看出,所有滞后阶数的自相关系数和偏自相关系数均和0没有显著的差异。