1、说明
实际问题中影响因变量的因素可能很多,我们希望从中挑选出影响显著的自变量来建立回归模型,这就涉及到变量的选择的问题,逐步回归是从众多变量中有效地选择重要变量方法。
2、例题
3、求解
clear
clc
x0=[1 7 26 6 60 78.5;
2 1 29 15 52 74.3;
3 11 56 8 20 104.3;
4 11 31 8 47 87.6;
5 7 52 6 33 95.9;
6 11 55 9 22 109.2;
7 3 71 17 6 102.7;
8 1 31 22 44 72.5;
9 2 54 18 22 93.1;
10 21 47 4 26 115.9;
11 1 40 23 34 83.8;
12 11 66 9 12 113.3;
13 10 68 8 12 109.4];
x=x0(:,2:5);
y=x0(:,6);
stepwise(x,y)
4、结果
第一步:
第二步:
第三步:
总结:最后红色部分表示已经移除为;
从统计结果可以看出,虽然剩余标准差s(RMSE)没有太大的变化,但是统计量F的值明显增大,因此新的回归模型更好一些。可以求出最终的模型为: