顾名思义,时间序列是包含特定时间段或时间戳的数据。它包含一定时间段内的观察结果。这类数据告诉我们变量是如何根据各种因素随时间变化的。时间序列分析和预测可以用来预测未来某个时间的数据。
单变量时间序列包含在一段时间内某些时间实例中针对单个变量获取的值。多元时间序列包含在相同的周期性时间实例中针对多个变量获取的值。
时间序列由以下四个部分组成-
它指的是数据值的平均值,其值围绕其变化。
顾名思义,它表明了数据集中数据点相对于时间的某种模式(增加,减少,中立等)。
它讲述了时间序列数据的重复性质/循环行为。
由于外部因素而隐式添加的观测值中的多余值。
关于时间序列有许多方法可用于捕获上述组件。让我们简要地了解其中的一些-
如果已提供给定变量的上次实际值,则可以使用简单的估算技术来预测其值。并不是真正地单独使用它,而是在使用复杂技术时更像参考点。
自回归是一种预测未来一段时间值的技术。它使用历史数据,i.e以前的时间段数据。数据可能更适合模型,但自回归不为“季节性”组件提供责任。
ARIMA代表“自动回归综合移动平均线”。它尝试将数据点的值预测为历史/先前数据点的线性函数。这样,以前出现的错误将被合并到预测数据中。在现实生活中,数据可能不是固定的,因此开发了季节性ARIMA和分数ARIMA。
指数平滑是一种将变量建模为数据集中先前值的指数加权线性函数的技术。这种模型可以很好地适应数据的趋势和季节性。
LSTM指的是长期短期记忆模型,这是一个递归神经网络,用于在存在长期依赖性时与时间序列模型一起使用。需要大量训练数据来收集多元时间序列数据集中的趋势。