趋势分析定义了在时间序列中提取行为模型的技术,这些行为模型可能会轻微或完全被噪声隐藏。趋势分析的方法已普遍用于检测疾病的爆发和意外的增加或减少,监测疾病的趋势,评估疾病控制计划和政策的有效性,以及评估医疗保健计划和政策的成功等。
可以使用各种技术来检测项目系列中的趋势。平滑是一种用于去除时间序列中发现的非系统行为的方法。平滑通常采用查找属性值的移动平均值的形式,给定一个特定时间点周围的时间窗口。
使用所有属性值的局部平均值,而不是此时找到的特定值。通常使用中值而不是平均值,因为它对异常值不太敏感。平滑可以滤除噪声和异常值。它可用于预测未来值,因为结果数据更容易拟合已知函数(线性、对数、指数等)
在时间序列数据中检测季节性模式更加困难。一种方法是在均匀分布的时间间隔内找到属性之间的相关性。例如,可以在每十二个值之间找到相关性(在每月销售数据中)。相关项目之间的时间差称为滞后。
可以生成自相关函数来确定不同滞后间隔的数据值之间的相关性。相关图以图形方式显示多个滞后值的自相关值。
协方差衡量两个变量如何一起变化。它可以用作确定两个时间序列或一个时间序列中的季节性趋势之间关系的基础。自相关系数 r k测量时间序列值之间的相关性一定距离,滞后 k,分开。
几种方法已用于自相关。正值表示两个变量一起增加,而负值表示一个增加另一个减少。
接近零的值表明两个变量之间几乎没有相关性。计算相关性的一个典型公式是相关系数 r,有时也称为 Pearson 的 r。
给定两个时间序列 X 和 Y,均值 X'和 Y',每个序列有 n 个元素,r 的公式为
$$\mathrm{\frac{\sum(x_i-X')(y_i-Y')}{\sqrt{\sum(x_i-X)^2(y_i-Y')^2}}}$$
在时间序列 X=(x 1 ,x 2 ,…x n ) 上,它可以直接找到具有 k、rk 滞后的相关系数。第一个时间序列是 X'=(x 1 ,x 2 ,…x n−k ),而第二个时间序列是 X''=(x k+1 ,x k+1 ,…x n )。