基于SPSS的相关分析、方差分析、回归分析

数据来源

mtcars {datasets} R Documentation

Motor Trend Car Road Tests

The data was extracted from the 1974 Motor Trend US magazine, and comprises fuel consumption and 10 aspects of automobile design and performance for 32 automobiles (1973–74 models).

Format

A data frame with 32 observations on 11 variables.

1
2
3
4
5
6
7
8
9
10
11
[, 1]	mpg	Miles/(US) gallon
[, 2] cyl Number of cylinders
[, 3] disp Displacement (cu.in.)
[, 4] hp Gross horsepower
[, 5] drat Rear axle ratio
[, 6] wt Weight (1000 lbs)
[, 7] qsec 1/4 mile time
[, 8] vs V/S
[, 9] am Transmission (0 = automatic, 1 = manual)
[,10] gear Number of forward gears
[,11] carb Number of carburetors

mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21 6 160 110 3.9 2.62 16.46 V-Engine Manual 4 4
Mazda RX4 Wag 21 6 160 110 3.9 2.875 17.02 V-Engine Manual 4 4
Datsun 710 22.8 4 108 93 3.85 2.32 18.61 Straight Engine Manual 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 Straight Engine Automatic 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.44 17.02 V-Engine Automatic 3 2
Valiant 18.1 6 225 105 2.76 3.46 20.22 Straight Engine Automatic 3 1
Duster 360 14.3 8 360 245 3.21 3.57 15.84 V-Engine Automatic 3 4
Merc 240D 24.4 4 146.7 62 3.69 3.19 20 Straight Engine Automatic 4 2
Merc 230 22.8 4 140.8 95 3.92 3.15 22.9 Straight Engine Automatic 4 2
Merc 280 19.2 6 167.6 123 3.92 3.44 18.3 Straight Engine Automatic 4 4
Merc 280C 17.8 6 167.6 123 3.92 3.44 18.9 Straight Engine Automatic 4 4
Merc 450SE 16.4 8 275.8 180 3.07 4.07 17.4 V-Engine Automatic 3 3
Merc 450SL 17.3 8 275.8 180 3.07 3.73 17.6 V-Engine Automatic 3 3
Merc 450SLC 15.2 8 275.8 180 3.07 3.78 18 V-Engine Automatic 3 3
Cadillac Fleetwood 10.4 8 472 205 2.93 5.25 17.98 V-Engine Automatic 3 4
Lincoln Continental 10.4 8 460 215 3 5.424 17.82 V-Engine Automatic 3 4
Chrysler Imperial 14.7 8 440 230 3.23 5.345 17.42 V-Engine Automatic 3 4
Fiat 128 32.4 4 78.7 66 4.08 2.2 19.47 Straight Engine Manual 4 1
Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 Straight Engine Manual 4 2
Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.9 Straight Engine Manual 4 1
Toyota Corona 21.5 4 120.1 97 3.7 2.465 20.01 Straight Engine Automatic 3 1
Dodge Challenger 15.5 8 318 150 2.76 3.52 16.87 V-Engine Automatic 3 2
AMC Javelin 15.2 8 304 150 3.15 3.435 17.3 V-Engine Automatic 3 2
Camaro Z28 13.3 8 350 245 3.73 3.84 15.41 V-Engine Automatic 3 4
Pontiac Firebird 19.2 8 400 175 3.08 3.845 17.05 V-Engine Automatic 3 2
Fiat X1-9 27.3 4 79 66 4.08 1.935 18.9 Straight Engine Manual 4 1
Porsche 914-2 26 4 120.3 91 4.43 2.14 16.7 V-Engine Manual 5 2
Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.9 Straight Engine Manual 5 2
Ford Pantera L 15.8 8 351 264 4.22 3.17 14.5 V-Engine Manual 5 4
Ferrari Dino 19.7 6 145 175 3.62 2.77 15.5 V-Engine Manual 5 6
Maserati Bora 15 8 301 335 3.54 3.57 14.6 V-Engine Manual 5 8
Volvo 142E 21.4 4 121 109 4.11 2.78 18.6 Straight Engine Manual 4 2
相关分析 (mpg~wr+qsec)
Correlations相关性
mpg wt qsec disp hp drat
mpg Pearson 相关性 1 -.868** .419* -.848** -.776** .681**
显著性(双侧) 0 0.017 0 0 0
N 32 32 32 32 32 32
wt Pearson 相关性 -.868** 1 -0.175 .888** .659** -.712**
显著性(双侧) 0 0.339 0 0 0
N 32 32 32 32 32 32
qsec Pearson 相关性 .419* -0.175 1 -.434* -.708** 0.091
显著性(双侧) 0.017 0.339 0.013 0 0.62
N 32 32 32 32 32 32
disp Pearson 相关性 -.848** .888** -.434* 1 .791** -.710**
显著性(双侧) 0 0 0.013 0 0
N 32 32 32 32 32 32
hp Pearson 相关性 -.776** .659** -.708** .791** 1 -.449**
显著性(双侧) 0 0 0 0 0.01
N 32 32 32 32 32 32
drat Pearson 相关性 .681** -.712** 0.091 -.710** -.449** 1
显著性(双侧) 0 0 0.62 0 0.01
N 32 32 32 32 32 32
**. 在 .01 水平(双侧)上显著相关。
*. 在 0.05 水平(双侧)上显著相关。

在0.01水平上:

mpg与 wt、qsec、disp、hp、drat 相关性显著;
wt 与 mpg、disp、hp、drat相关性显著;
sqec 与 mpg、disp、hp、drat 相关性显著;
disp 与 mpg、wt、qsec、hp、drat 相关性显著;
hp 与 mpg、wt、qsec、disp、drat 相干性显著;
drat 与 mpg、wt、qsec、disp、hp 相关性显著;

单因素方差分析(cyl~mpg)

Oneway

描述 mpg
N 均值 标准差 标准误 均值的 95% 置信区间 极小值
下限 上限
4 11 26.664 4.5098 1.3598 23.634 29.693 21.4
6 7 19.743 1.4536 0.5494 18.399 21.087 17.8
8 14 15.1 2.56 0.6842 13.622 16.578 10.4
总数 32 20.091 6.0269 1.0654 17.918 22.264 10.4
方差齐性检验 mpg
Levene 统计量 df1 df2 显著性
6.484 2 29 0.005
单因素方差分析 mpg
平方和 df 均方 F 显著性
组间 824.785 2 412.392 39.698 .000
组内 301.263 29 10.388
总数 1126.047 31

由于Levene检验没有证据说明三种 cyl 的方差相等,参照两种不同的两两比较的结果是必要的。

Post Hoc Tests

多重比较
因变量: mpg
(I) cyl (J) cyl 均值差 (I-J) 标准误 显著性 95% 置信区间
下限 上限
Bonferroni 4 6 6.9208* 1.5583 0 2.961 10.88
8 11.5636* 1.2986 0 8.264 14.863
6 4 -6.9208* 1.5583 0 -10.88 -2.961
8 4.6429* 1.492 0.012 0.852 8.434
8 4 -11.5636* 1.2986 0 -14.863 -8.264
6 -4.6429* 1.492 0.012 -8.434 -0.852
Tamhane 4 6 6.9208* 1.4666 0.001 2.905 10.937
8 11.5636* 1.5222 0 7.475 15.652
6 4 -6.9208* 1.4666 0.001 -10.937 -2.905
8 4.6429* 0.8775 0 2.34 6.945
8 4 -11.5636* 1.5222 0 -15.652 -7.475
6 -4.6429* 0.8775 0 -6.945 -2.34
*. 均值差的显著性水平为 0.05。

Bonferroni和Tamhane多重比较的结果是一致的, cyl 的数量 4、6和8有显著区别。

Homogeneous Subsets

mpg
cyl N alpha = 0.05 的子集
1 2 3
Tukey Ba,b 8 14 15.1
6 7 19.743
4 11 26.664
将显示同类子集中的组均值。
a. 将使用调和均值样本大小 = 9.830。
b. 组大小不相等。将使用组大小的调和均值。将不保证 I 类错误级别。

Tukey B两两比较输出的结果,它把在5%的显著性水平下没有区别的总体放在同一列,作为同类子集。Cyl 数量为4,Cyl 数量为6,Cyl 数量为8有显著区别,各自单独分为一类

Means Plots
Means Plots
轮廓图为各个总体的均值的折线图,从中可以直观的看出各个总体均值的趋势。

回归分析
一元线性回归模型(mpg~wt,前进法)

Regression

输入/移去的变量a
模型 输入的变量 移去的变量 方法
1 wtb . 输入
a. 因变量: mpg
b. 已输入所有请求的变量。
模型汇总b
模型 R R 方 调整 R 方 标准 估计的误差
1 .868a 0.753 0.745 3.0459
a. 预测变量: (常量), wt。
b. 因变量: mpg
Anovaa
模型 平方和 df 均方 F Sig.
1 回归 847.725 1 847.725 91.375 .000b
残差 278.322 30 9.277
总计 1126.047 31
a. 因变量: mpg
b. 预测变量: (常量), wt。
系数a
模型 非标准化系数 标准系数 t Sig.
B 标准 误差 试用版
1 (常量) 37.285 1.878 19.858 0
wt -5.344 0.559 -0.868 -9.559 0
a. 因变量: mpg
残差统计量a
极小值 极大值 均值 标准 偏差 N
预测值 8.297 29.199 20.091 5.2293 32
残差 -4.5432 6.8727 0 2.9964 32
标准 预测值 -2.255 1.742 0 1 32
标准 残差 -1.492 2.256 0 0.984 32
a. 因变量: mpg

判定系数 R ̅^2 = 0.745,拟合优度较高,不被解释变量较少;
对于常系数, sig.=0.00<0.05,回归系数显著不为0;
对于wt,sig.=0.00<0.05,回归系数显著不为0;
在方差分析表中,sig.=0.00<0.01,回归模型非常显著
回归方程为:mpg = -5.344*wt + 37.285

多元线性回归模型(mpg~disp+drat+wt+qsec,逐步回归)

Regression

输入/移去的变量a
模型 输入的变量 移去的变量 方法
1 wt . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。
2 qsec . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。
a. 因变量: mpg
模型汇总c
模型 R R 方 调整 R 方 标准 估计的误差
1 .868a 0.753 0.745 3.0459
2 .909b 0.826 0.814 2.5962
a. 预测变量: (常量), wt。
b. 预测变量: (常量), wt, qsec。
c. 因变量: mpg
Anovaa
模型 平方和 df 均方 F Sig.
1 回归 847.725 1 847.725 91.375 .000b
残差 278.322 30 9.277
总计 1126.047 31
2 回归 930.584 2 465.292 69.033 .000c
残差 195.464 29 6.74
总计 1126.047 31
a. 因变量: mpg
b. 预测变量: (常量), wt。
c. 预测变量: (常量), wt, qsec。
系数a
模型 非标准化系数 标准系数 t Sig.
B 标准 误差 试用版
1 (常量) 37.285 1.878 19.858 0
wt -5.344 0.559 -0.868 -9.559 0
2 (常量) 19.746 5.252 3.76 0.001
wt -5.048 0.484 -0.82 -10.43 0
qsec 0.929 0.265 0.275 3.506 0.001
a. 因变量: mpg
已排除的变量a
模型 Beta In t Sig. 偏相关 共线性统计量
容差
1 disp -.364b -1.929 0.064 -0.337 0.211
drat .128b 0.989 0.331 0.181 0.492
qsec .275b 3.506 0.001 0.546 0.969
2 disp -.003c -0.012 0.99 -0.002 0.131
drat .147c 1.35 0.188 0.247 0.491
a. 因变量: mpg
b. 模型中的预测变量: (常量), wt。
c. 模型中的预测变量: (常量), wt, qsec。
残差统计量a
极小值 极大值 均值 标准 偏差 N
预测值 8.924 28.974 20.091 5.4789 32
残差 -4.3962 5.7486 0 2.511 32
标准 预测值 -2.038 1.621 0 1 32
标准 残差 -1.693 2.214 0 0.967 32
a. 因变量: mpg

ss回归方程1:
判定系数 R ̅^2 = 0.745,拟合优度较高,不被解释变量较少;
对于常系数, sig.=0.00<0.05,回归系数显著不为0;
对于wt,sig.=0.00<0.05,回归系数显著不为0;
在方差分析表中,sig.=0.00<0.01,回归模型非常显著
回归方程为:mpg = -5.344wt + 37.285
回归方程2:
判定系数 R ̅^2 = 0.814,拟合优度较高,不被解释变量较少;
对于常系数, sig.=0.01<0.05,回归系数显著不为0;
对于wt,sig.=0.00<0.05,回归系数显著不为0;
对于sqec,sig.=0.00<0.05,回归系数显著不为0;
在方差分析表中,sig.=0.00<0.01,回归模型非常显著
回归方程为:mpg = -5.048
wt + 0.929*qsec + 19.746