Pandas着眼于数据的读取、处理和探索,而StatsModels则更加注重数据的统计建模分析,它使得Python有了R语言的味道。StatsModels支持与Pandas进行数据交互,因此,它与Pandas结合,成为了Python下强大的数据挖掘组合。
安装StatsModels相当简单,既可以通过pip安装,又可以通过源码安装。对于Windows用户来说,官网上甚至已经有编译好的exe文件以供下载。如果手动安装的话,需要自行解决好依赖问题,StatModel依赖于Pandas(当然也依赖于Pandas所依赖的),同时还依赖于pasty(一个描述统计的库)。
下面是一个用StatsModels来进行ADF平稳性检验的例子。
# -*- coding: utf-8 -*-
from statsmodels.tsa.stattools import adfuller as ADF #导入ADF检验
import numpy as np
ADF(np.random.rand(100)) #返回的结果有ADF值、p值等
参考链接:
http://statsmodels.sourceforge.net/stable/index.html。
http://jingyan.baidu.com/season/43456。