时间序列分析
时间序列分析作用
时间序列分析是分析在一段时间内收集的一系列数据点的一种特定方法。在时间序列分析中,分析师在一段固定的时间内以一致的间隔记录数据点,而不是间歇性或随机地记录数据点。然而,这种分析不仅仅是随着时间的推移收集数据的行为。
时间序列数据与其他数据的区别在于,分析可以显示变量随时间的变化情况。换句话说,时间是一个关键变量,因为它显示了数据在数据点以及最终结果过程中如何调整。它提供了额外的信息来源和数据之间的一组依赖关系顺序。
时间序列分析通常需要大量数据点来确保一致性和可靠性。广泛的数据集可确保您拥有具有代表性的样本量,并且分析可以消除噪声数据。它还可以确保发现的任何趋势或模式都不是异常值,并且可以解释季节性差异。此外,时间序列数据可用于预测 - 根据历史数据预测未来数据。
时间序列分析可帮助组织了解一段时间内趋势或系统模式的根本原因。使用数据可视化,业务用户可以查看季节性趋势并深入了解这些趋势出现的原因。借助现代分析平台,这些可视化可以远远超越线形图。
当组织以一致的时间间隔分析数据时,他们还可以使用时间序列预测来预测未来事件发生的可能性。时间序列预测是预测分析的一部分。它可以显示数据中可能的变化,例如季节性或周期性行为,从而更好地理解数据变量并有助于更好地预测。
例如,得梅因公立学校分析了五年的学生成绩数据,以识别有风险的学生并跟踪一段时间内的进步情况。如今的技术使我们能够每天收集大量数据,而且收集足够一致的数据进行全面分析比以往任何时候都更加容易。
时间序列分析示例
时间序列分析用于非平稳数据——随时间不断波动或受时间影响的数据。金融、零售和经济等行业经常使用时间序列分析,因为货币和销售额总是在变化。股票市场分析是时间序列分析应用的一个极好例子,尤其是在自动交易算法中。同样,时间序列分析非常适合预测天气变化,帮助气象学家预测从明天的天气预报到未来几年的气候变化的一切。时间序列分析的应用示例包括:
- 天气数据
- 降雨量测量
- 温度读数
- 心率监测(EKG)
- 脑部监测(EEG)
- 季度销售额
- 股票价格
- 自动股票交易
- 行业预测
- 利率
时间序列分析类型
由于时间序列分析涉及许多类别或数据变体,分析师有时必须建立复杂的模型。然而,分析师无法解释所有方差,也无法将特定模型推广到每个样本。过于复杂或试图做太多事情的模型可能会导致拟合度不足。拟合度不足或过度拟合的模型会导致这些模型无法区分随机误差和真实关系,从而使分析出现偏差,预测不正确。
时间序列分析模型包括:
- 分类:识别数据并分配类别。
- 曲线拟合:沿曲线绘制数据以研究数据内变量的关系。
- 描述性分析:识别时间序列数据中的模式,如趋势、周期或季节性变化。
- 解释性分析:试图了解数据及其内部的关系以及因果关系。
- 探索性分析:突出时间序列数据的主要特征,通常采用可视化格式。
- 预测:预测未来数据。此类型基于历史趋势。它使用历史数据作为未来数据的模型,预测未来情节可能发生的情况。
- 干预分析:研究事件如何改变数据。
- 分割:将数据分成几段以显示源信息的底层属性。
数据分类
此外,时间序列数据可以分为两大类:
- 股票时间序列数据意味着测量某个时间点的属性,就像信息的静态快照一样。
- 流时间序列数据是指测量一定时期内属性的活跃程度,一般是整体的一部分,构成结果的一部分。
数据变化
在时间序列数据中,变化可能在整个数据中偶尔发生:
- 功能分析可以找出数据中的模式和关系来识别值得注意的事件。
- 趋势分析是指确定某一方向的持续运动。趋势有两种类型:确定性趋势,我们可以找到根本原因;随机性趋势,随机且无法解释。
- 季节性变化描述的是一年中以特定且规律的间隔发生的事件。当时间上相近的数据点趋于相关时,就会出现序列依赖性。
时间序列分析和预测模型必须定义与回答业务问题相关的数据类型。分析师一旦选择了他们想要分析的相关数据,他们就会选择最适合的分析类型和技术。
时间序列分析的重要考虑因素
虽然时间序列数据是随时间收集的数据,但有不同类型的数据来描述时间数据的记录方式和时间。例如:
- 时间序列数据是在一致的时间间隔内记录的数据。
- 横截面数据由同时记录的几个变量组成。
- 汇总数据是时间序列数据和横截面数据的组合。