如何做数据统计与分析 10种数据分析方法


如何做数据统计与分析 10种数据分析方法



时间序列(time series)是系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律 。它是系统中某一变量受其它各种因素影响的总结果 。
研究时间序列主要目的可以进行预测,根据已有的时间序列数据预测未来的变化 。时间序列预测关键:确定已有的时间序列的变化模式,并假定这种模式会延续到未来 。
如何做数据统计与分析 10种数据分析方法


时间序列的基本特点
假设事物发展趋势会延伸到未来
预测所依据的数据具有不规则性
不考虑事物发展之间的因果关系
时间序列数据用于描述现象随时间发展变化的特征 。
如何做数据统计与分析 10种数据分析方法


时间序列考虑因素
时间序列分析就其发展历史阶段和所使用的统计分析方法看分为传统的时间序列分析和现代时间序列分析,根据观察时间的不同,时间序列中的时间可以是可以是年份、季度、月份或其他任何时间形式 。
时间序列分析时的主要考虑的因素是:
l长期趋势(Long-term trend)
时间序列可能相当稳定或随时间呈现某种趋势 。
时间序列趋势一般为线性的(linear),二次方程式的 (quadratic)或指数函数(exponential function) 。
l季节性变动(Seasonal variation)
按时间变动,呈现重复性行为的序列 。
季节性变动通常和日期或气候有关 。
季节性变动通常和年周期有关 。
l周期性变动(Cyclical variation)
相对于季节性变动,时间序列可能经历“周期性变动” 。
周期性变动通常是因为经济变动 。
l随机影响(Random effects)
除此之外,还有偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动 。时间序列除去趋势、周期性和季节性后的偶然性波动,称为随机性(random),也称不规则波动(irregular variations) 。
如何做数据统计与分析 10种数据分析方法


时间序列的主要成分
时间序列的成分可分为4种:
l趋势(T)、
l季节性或季节变动(S)、
l周期性或循环波动(C)、
l随机性或不规则波动(I) 。
传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达,而后分别进行分析 。
如何做数据统计与分析 10种数据分析方法


时间序列建模基本步骤
1)用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据 。
2)根据动态数据作相关图,进行相关分析,求自相关函数 。
相关图能显示出变化的趋势和周期,并能发现跳点和拐点 。
跳点是指与其他数据不一致的观测值 。如果跳点是正确的观测值,在建模时应考虑进去,如果是反常现象,则应把跳点调整到期望值 。
拐点则是指时间序列从上升趋势突然变为下降趋势的点 。如果存在拐点,则在建模时必须用不同的模型去分段拟合该时间序列,例如采用门限回归模型 。
3)辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据 。
对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合 。
对于平稳时间序列,可用通用ARMA模型(自回归滑动平均模型)及其特殊情况的自回归模型、滑动平均模型或组合-ARMA模型等来进行拟合 。

推荐阅读