Python：如何评估 StatsModels 中的残差？

Question

提问by DanielTheRocketMan

I want to evaluate the residuals: (y-hat y).

我想评估残差：（y-hat y）。

I know how to do that:

我知道该怎么做：

df = pd.read_csv('myFile', delim_whitespace = True, header = None)
df.columns = ['column1', 'column2']
y, X = ps.dmatrices('column1 ~ column2',data = df, return_type = 'dataframe')
model = sm.OLS(y,X)
results = model.fit()
predictedValues = results.predict()
#print predictedValues
yData = df.as_matrix(columns = ['column1'])
res = yData - predictedValues

I wonder if there is a Method to do this (?).

我想知道是否有一种方法可以做到这一点（？）。

Answer 1

采纳答案by TomAugspurger

That's stored in the residattribute of the Results class

这存储在Results 类的resid属性中

Likewise there's a results.fittedvaluesmethod, so you don't need the results.predict().

同样有一个results.fittedvalues方法，所以你不需要results.predict().

Answer 2

回答by SciPy

Normality of the residuals

残差的正态性

Option 1: Jarque-Bera test

选项 1：Jarque-Bera 测试

name = ['Jarque-Bera', 'Chi^2 two-tail prob.', 'Skew', 'Kurtosis']
test = sms.jarque_bera(results.resid)
lzip(name, test)

Out:

出去：

[('Jarque-Bera', 3.3936080248431666),
 ('Chi^2 two-tail prob.', 0.1832683123166337),
 ('Skew', -0.48658034311223375),
 ('Kurtosis', 3.003417757881633)]
Omni test:

Option 2: Omni test

选项 2：Omni 测试

name = ['Chi^2', 'Two-tail probability']
test = sms.omni_normtest(results.resid)
lzip(name, test)

Out:

出去：

[('Chi^2', 3.713437811597181), ('Two-tail probability', 0.15618424580304824)]

Python：如何评估 StatsModels 中的残差？

提问by DanielTheRocketMan

采纳答案by TomAugspurger

回答by SciPy

相关推荐

最近更新

标签

Python：如何评估 StatsModels 中的残差？

提问by DanielTheRocketMan

采纳答案by TomAugspurger

回答by SciPy

相关推荐

Python 如何以张量为范围运行循环？（在张量流中）

使用Chrome驱动程序通过python和selenium下载指定位置的文件

Python Tensorflow 图中的张量名称列表

python datetime以毫秒精度浮动

相关推荐

最近更新

标签