SPSS多元线性回归分析实施报告实例操作步骤

|idpi

 SPSS 统计分析

 多元线性回归分析法操作与分析

 实验目的:

 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。

 实验变量:

 以年份、商品房平均售价(元/平米)、上海市城市人口密度(人/平公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。

 实验法:多元线性回归分析法

  软件:spss19.0

 操作过程:

 第一步:导入Excel数据文件

 1. open data document——open data——open;

 

  2. Opening excel data source——OK.

  第二步:

 1.在最上面菜单里面选中 Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择 Stepwise. 进入如下界面:

 2.点击右侧 Statistics,勾选 Regression Coefficients(回归系数)选项组中的 Estimates;勾选 Residuals(残差)选项组中的 Durbin-Watson、Casewise diagnostics 默认;接着选择 Model fit、Collinearity diagnotics;点击Continue.

  3.点击右侧 Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的 Standardized Residual Plots(标准化残差图)中的 Histogram、Normal probability plot;点击 Continue.

 4.点击右侧 Save,勾选 Predicted Vaniues(预测值)和 Residuals(残差)选项组中的 Unstandardized;点击 Continue.

 5.点击右侧 Options,默认,点击 Continue.

 6.返回主对话框,单击 OK.

 输出结果分析:

 1.引入/剔除变量表

  该表显示模型最先引入变量城市人口密度 (人/平公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。

 2. 模型汇总

 Variables Entered/Removed a a

 Model Variables Entered Variables Removed Method 1 城市人口密度

 (人/平公里) . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). 2 城市居民人均可支配收入(元) . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). a. Dependent Variable: 商品房平均售价(元/平米)

 Model Summary c c

 Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 1.000 a

 1.000 1.000 35.

 2 1.000 b

 1.000 1.000 28.351 2.845 a. Predictors: (Constant), 城市人口密度

 (人/平公里) b. Predictors: (Constant), 城市人口密度

 (人/平公里), 城市居民人均可支配收入(元) c. Dependent Variable: 商品房平均售价(元/平米)

  该表显示模型的拟合情况。从表中可以看出,模型的复相关系数(R)为 1.000,判定系数(R Square)为 1.000,调整判定系数(Adjusted R Square)为 1.000,估计值的标准误差(Std. Error of the Estimate)为 28.351,Durbin-Watson 检验统计量为 2.845,当 DW≈2 时说明残差独立。

 3. 差分析表

 ANOVA c c

 Model Sum of Squares df Mean Square F Sig. 1 Regression 38305583.506 1 38305583.506 30938.620 .000 a

 Residual 11143.039 9 1238.115

  Total 38316726.545 10

 2 Regression 38310296.528 2 19155148.264 23832. .000 b

 Residual 6430.018 8 803.752

  Total 38316726.545 10

 a. Predictors: (Constant), 城市人口密度

 (人/平公里) b. Predictors: (Constant), 城市人口密度

 (人/平公里), 城市居民人均可支配收入(元) c. Dependent Variable: 商品房平均售价(元/平米)

 该表显示各模型的差分析结果。从表中可以看出,模型的 F 统计量的观察值为 23832.,概率 p 值为 0.000,在显著性水平为 0.05 的情形下,可以认为:商品房平均售价(元/平米)与城市人口密度 (人/平公里),和城市居民人均可支配收入(元)之间有线性关系。

 4. 回归系数 Coefficients a a

  该表为多元线性回归的系数列表。表中显示了模型的偏回归系数(B)、标准误差(Std. Error)、常数(Constant)、标准化偏回归系数(Beta)、回归系数检验的 t 统计量观测值和相应的概率 p 值(Sig.)、共线性统计量显示了变量的容差(Tolerance)和差膨胀因子(VIF)。

 令 x 1 表示城市人口密度(人/平公里),x 2 表示城市居民人均可支配收入(元),根据模型建立的多元多元线性回归程为:

 y=1555.506+1.020 x 1

 +0.017x 2 程中的常数项为 1555.506,偏回归系数 b1 为 1.020,b2 为 0.017,经T 检验,b1 和 b2 的概率 p 值分别为 0.000 和 0.,按照给定的显著性水平0.10 的情形下,均有显著性意义。

 根据容差发现,自变量间共线性问题重;VIF 值为 20.126,也可以说明共线性较明显。这可能是由于样本容量太小造成的。

 5. 模型外的变量

 Model Unstandardized Coefficients Standardized Coefficients T Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 1652.246 24.137

 68.454 .000

  城市人口密度

 (人/平公里) 1.072 .006 1.000 175.894 .000 1.000 1.000 2 (Constant) 1555.506 44.432

 35.009 .000

  城市人口密度

 (人/平公里) 1.020 . .951 46.302 .000 .050 20.126 城市居民人均可支配收入(元) .017 .007 .050 2.422 . .050 20.126 a. Dependent Variable: 商品房平均售价(元/平米)

 Excluded Variables c c

 Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance VIF Minimum Tolerance

  该表显示的是回归程外的各模型变量的有关统计量,可见模型程外的各变量偏回归系数经重检验,概率 p 值均大于 0.10,故不能引入程。

 6. 共线性诊断

 该表是多重共线性检验的特征值以及条件指数。对于第二个模型,最大特征值为 2.891,其余依次快速减小。第三列的各个条件指数,可以看出有多重共线性。

 7. 残差统计量

 1 城市居民人均可支配收入(元) .050 a

 2.422 . .650 .050 20.126 .050 五年以上平均年贷款利率(%) -.001 a

 -.241 .815 -. .999 1.001 .999 房屋空置率(%) .004 a

 .596 .568 .206 .928 1.078 .928 2 五年以上平均年贷款利率(%) .002 b

 .391 .708 .146 .913 1.096 . 房屋空置率(%) .002 b

 .452 .665 .168 .914 1.094 .049 a. Predictors in the Model: (Constant), 城市人口密度

 (人/平公里) b. Predictors in the Model: (Constant), 城市人口密度

 (人/平公里), 城市居民人均可支配收入(元) c. Dependent Variable: 商品房平均售价(元/平米)

 Collinearity Diagnostics a a

 Model Dimension Eigenvalue Condition Index Variance Proportions (Constant) 城市人口密度

 (人/平公里) 城市居民人均可支配收入(元) 1 1 1.898 1.000 .05 .05

 2 .102 4.319 .95 .95

 2 1 2.891 1.000 .00 .00 .00 2 .106 5.213 .21 .03 .00 3 .003 30.736 .78 .97 1.00 a. Dependent Variable: 商品房平均售价(元/平米)

 该表为回归模型的残差统计量,标准化残差(Std. Residual)的绝对值最大为 1.659,没有超过默认值 3,不能发现奇异值。

 8. 回归标准化残差的直图

  该图为回归标准化残差的直图,正态曲线也被显示在直图上,用以判断标准化残差是否呈正态分布。但是由于样本数只有 11 个,所以只能大概判断其呈正态分布。

 Residuals Statistics a a

  Minimum Maximum Mean Std. Deviation N Predicted Value 3394.71 8382.83 5465.64 1957.302 11 Residual -47. 40.271 .000 25.357 11 Std. Predicted Value -1. 1.490 .000 1.000 11 Std. Residual -1.659 1.420 .000 .894 11 a. Dependent Variable: 商品房平均售价(元/平米)

 9.回归标准化的正态 P-P 图

 该图回归标准化的正态 P-P 图,该图给出了观测值的残差分布与假设的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判断标准化残差呈正态分布。

 10.因变量与回归标准化预测值的散点图

 该图显示的是因变量与回归标准化预测值的散点图,其中DEPENDENT 为 x 轴变量,*ZPRED 为 y 轴变量。由图可见,两变量呈直线趋势。

  附件:

 原始数据:

 自变量散点图:

 由散点图可以看出,可进入分析的变量为城市人口密度、城市居民人均可支配收入。

推荐访问:线性 操作步骤 实例