|
目前关于逐步回归的原理和计算实例在网上都有所展现,但是要么语焉不详,要么计算错误,给我们的理解带来更多障碍,鉴于此,重新整理如下,供大家参考。
1. 算法原理
1.1建立相关矩阵R,决定F1,F2, F1³
F2
对于给定的原始数据
,i=1,2,…,n
,计算
(j,k=1,2,…
,m;y)
(j,=1,2,… ,m;y)
每列的总离差平方和Sigmaxj2=
Sigmayy2=
得到,此时L=0;
1.2 计算出全部自变量的标准偏回归平方和
(j=1,2,… ,m)
1.3逐步计算
在未引入的变量(1.1步中原始数据)中,找出偏回归平方和最大的那个自变量,仍设为xk,并计算F值
若,则引入xk,使矩阵R从R(l)® R(l+1)
(公式同上),引入变量数从L-L+1,再转向本阶段开头。
若,则意味着既无变量引入,也无变量剔除。
是指。
即对矩阵R进行变换(R(l)- R(l+1)):
实际上是作Gauss-Jordan变换。此时引入变量数从L-L-1,
然后转向1.2步继续进行下一步计算。
1.4 在已引入的L个变量中,找出偏回归平方和最小的那个自变量,设为xk
(在L=0时,该步不做,直接到下一步)
计算F值
若
,就将xk剔除出去.(可以先引入变量,而不剔除任何已引入的变量)。
1.5 假若最终进行了l步计算,引入了L个变量,
相关矩阵
我们可以看到,需要的全部结果都在该矩阵内。
1. 6回归方程式
如果r(l)jy不等于r(l)yj(r(l)jy
= -r(l)yj)(j=1,2,…,m),则该变量被引入到回归方程式中,标准回归系数b'(L)
j= r(l)jy
(j属于(L))
原回归系数
1.7 统计量
标准剩余(偏差)平方和
S'(L) D=
r(l)yy
标准回归平方和
S'
(L) R=1-S' (L)
D
剩余(偏差)平方和
S (L) D= S T* S' (L)
D
回归平方和
S (L) R= S T* S' (L)
R
F统计量
复相关系数
2.
计算实例
Original Data
7.00000
26.00000
6.00000
60.00000
78.50000
1.00000
29.00000
15.00000
52.00000
74.30000
11.00000 56.00000
8.00000
20.00000
104.30000
11.00000 31.00000
8.00000
47.00000
87.60000
7.00000
52.00000
6.00000
33.00000
95.90000
11.00000 55.00000
9.00000
22.00000
109.20000
3.00000
71.00000
17.00000
6.00000
102.70000
2.00000
31.00000
22.00000
44.00000
72.50000
2.00000
54.00000
18.00000
22.00000
93.10000
21.00000 47.00000
4.00000
26.00000
115.90000
1.00000
40.00000
23.00000
34.00000
83.80000
11.00000 66.00000
9.00000
12.00000
113.30000
10.00000 68.00000
8.00000
12.00000
109.40000
Mean-value matrix
7.5385
48.154
11.769
30.000
95.423
ST(即Sigmayy2)=
2715.763000
输入行数、列数F1=
13.000000 F2=
4.000000
Step:
0 Num=
0
Num=
0
Matrix R
1.0000
.2161
-.8133
-.2370
.7196
.2161
1.0000
-.1392
-.9730
.8163
-.8133 -.1392 1.0000
.0295
-.5347
-.2370 -.9730
.0295
1.0000
-.8213
.7196
.8163
-.5347
-.8213
1.0000
X- 1 P= .51783
F= 11.814
X- 2 P= .66627
F= 21.961
X- 3 P= .28587
F= 4.4034
X- 4 P= .67454 F=
22.799
Step:
1
Num=
1
Matrix R
.9438
-.0145
-.8063
.2370
.5249
-.0145
.0534
-.1105
.9730
.0172
-.8063 -.1105
.9991
-.0295
-.5104
-.2370 -.9730
.0295
1.0000
-.8213
.5249
.0172
-.5104
.8213
.3255
X- 1 P= .29194
F= 87.109
X- 2 P= .55185E-02 F= .17249
X- 3 P= .26075
F= 40.294
Variables chosen are as
follow:
X-- 4 b= -.73816
P= .67454
F= 22.799
B0=
117.567900
R= .8213050
FT= 22.79851
SR= 1831.896
SD= 883.8672
Y
YE
Y-YE
78.500
73.278
5.2218
74.300
79.184
-4.8835
104.30
102.80
1.4953
87.600
82.874
4.7257
95.900
93.209
2.6914
109.20
101.33
7.8716
102.70
113.14
-10.439
72.500
85.089
-12.589
93.100
101.33
-8.2284
115.90
98.376
17.524
83.800
92.470
-8.6704
113.30
108.71
4.5900
109.40
108.71
.69001
Step:
2
Num=
2
Matrix R
1.0595 -.0154 -.8543
.2512
.5562
.0154
.0531
-.1229
.9766
.0252
.8543
-.1229
.3102
.1730
-.0619
.2512
-.9766
-.1730
1.0595
-.6895
-.5562
.0252
-.0619
.6895
.0335
X- 2 P= .11989E-01 F= 5.0126
X- 3 P= .12370E-01 F= 5.2653 (P的最大值在X3,但是F已经很小了,所以不能再引入变量了)
Variables chosen are as
follow:
X-- 4 b= -.61967
P= .44865
F= 133.87
X-- 1 b= 1.4434
P= .29194
F= 87.109
B0=
103.132400
R= .9830999
FT= 144.1884(最后的F统计量 )
SR= 2624.745
SD= 91.01791
Y
YE
Y-YE
78.500
76.056
2.4442
74.300
72.353
1.9471
104.30
106.62
-2.3160
87.600
89.885
-2.2850
95.900
92.787
3.1131
109.20
105.38
3.8233
102.70
103.74
-1.0445
72.500
78.754
-6.2537
93.100
92.386
.71358
115.90
117.33
-1.4317
83.800
83.507
.29300
113.30
111.57
1.7266
109.40
110.13
-.73003 引用:昆山注册公司
|
上一篇:氨气气体泄漏检测仪器下一篇:2013年7月19日签到记录贴
|