什么是时间序列数据库?

时间序列数据库包括在重复评估时间期间访问的值或事件序列。这些值通常以相等的时间间隔(例如,每小时、每天、每周)计算。时间序列数据库在许多应用中都很流行,例如股票市场分析、经济和销售预测、预算分析、效用研究、库存研究、产量预测、工作量预测、过程和质量控制、自然现象(包括大气、温度)的观察、风和地震)、数值和工程实验以及医学治疗。

时间序列数据库也是序列数据库。序列数据库是包含有或没有具体时间方法的有序事件序列的任何数据库。例如,网页遍历序列和客户购物交易序列是序列数据,但可能不是时序数据。

随着大量传感器、遥测设备和其他在线数据采集工具的不断部署,时间序列数据量正在迅速增加,通常达到每天千兆字节(如股票交易)甚至每分钟(例如来自 NASA 太空计划)。

一个包含变量 Y 的时间序列,例如表示股票市场中股票的每日收盘价,可以看作是时间 t 的函数,即 Y = F(t)。趋势分析包括以下四个主要元素或以时间序列数据为特色的运动 -

趋势或长期运动- 这些表示时间序列图在很长一段时间内移动的总体方向。这种运动由趋势曲线或趋势线显示。例如,趋势曲线用虚线表示。确定趋势曲线或趋势线的典型方法包括加权移动平均法和最小二乘法,稍后讨论。

循环运动或循环变化- 这些是指循环,即关于趋势线或曲线的长期振荡,可能是也可能不是周期性的。也就是说,在相等的时间间隔之后,循环不一定遵循完全相似的模式。

季节性变动或季节性变化- 这些是系统的或与日历相关的。示例包括每年都会发生的事件,例如情人节前巧克力和鲜花的销量或圣诞节前百货商店商品的销量突然增加。另一个例子是观察到的夏季由于温暖天气而导致的用水量增加。在这些示例中,季节性运动是时间序列在连续年份的相应月份中似乎遵循的相同或几乎相同的模式。

不规则或随机运动- 这些描述了由于随机或偶然事件(例如劳资纠纷、洪水或公司内部宣布的人事变动)引起的时间序列的零星运动。