数学建模笔记3—线性回归模型

线性回归基本含义:在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

matlab中代码实现:

(1)b=regress( Y,  X ) 确定回归系数的点估计值
其中,Yn*1的矩阵;X为(ones(n,1),x1,…,xm)的矩阵;

(2)[b, bint,r,rint,stats]=regress(Y,X,alpha) 求回归系数的点估计和区间估计,并检验回归模型

                        b 回归系数
                 bint 回归系数的区间估计
                r 残差
                rint 残差置信区间
                stats 用于检验回归模型的统计量,有四个数值:相关系数R2F值、与F对应的概率p,误差方差。相关系数R2越接近1,说明回归方程越显著;F > F1-α(kn-k-1)时拒绝H0F越大,说明回归方程越显著;与F对应的概率时拒绝H0,回归模型成立。p值在0.01-0.05之间,越小越好。

(3)出残差以及其置信区间rcoplot(r,rint);
                                                      例子一 
  

通过以上数据,建立线性回归模型,运用matlab中regress函数求解
代码:

     L=[76;74;91;92;101;101;103;102;109;108]; 

>> y=[100;100;50;50;25;25;12.5;12.5;0;0]; 

>> x=[ones(10,1),L]; 

>> [b,bint,r,rint,stats]=regress(y,x)

运行结果:

b =


  325.2068
   -3.0063




bint =


  304.1089  346.3047
   -3.2252   -2.7875




r =


    3.2751
   -2.7376
   -1.6298
    1.3765
    3.4336
    3.4336
   -3.0537
   -6.0601
    2.4843
   -0.5220




rint =


   -2.9050    9.4552
   -8.7473    3.2722
   -9.6519    6.3923
   -6.7100    9.4630
   -4.1220   10.9892
   -4.1220   10.9892
  -10.6418    4.5344
  -12.1846    0.0645
   -4.8103    9.7789
   -8.2092    7.1652




stats =


   1.0e+03 *


    0.0010    1.0037    0.0000    0.0124


然后可得:中可以看出 2 R 近似为 1,F 值大于 F 检验的临界值,p 远小于

0.05,且每个回归系数的置信区间没有包含零点,说明灰度值 L 对浓度 M 影响是显著的,其预测方程的关系式为: M= 325.2068-3.0063 L 


同上用regress构建回归可得到下表:


但是从上表可以看出出 2 R 为 0.9073,F 值大于 F 检验的临界值, p 远小于 0.05,且每个回归系数的置信区间没有包含零点,说明灰度值 L 对浓度 M 影响是显著的。说明溴酸钾溶液的浓度可以通过颜色读数来确定,其预测方程的关系式为:M=729.551-5.2748L

模型改进:用二次函数构建回归模型 

代码如下:

L=[122;122;127;127;131;132;135;135;141;140];

y=[100;100;50;50;25;25;12.5;12.5;0;0]; 

for(i=1:10) 
lt(i,1)=L(i,1)*L(i,1); 
end
>> x=[ones(10,1),lt,L]; 

>> [b,bint,r,rint,stats]=regress(y,x)

运行结果:

b =


   1.0e+03 *


    5.5612
    0.0003
   -0.0791




bint =


   1.0e+03 *


    4.6035    6.5190
    0.0002    0.0003
   -0.0937   -0.0645




r =


    1.4587
    1.4587
   -3.2317
   -3.2317
   -2.1077
    3.0173
    2.5175
    2.5175
   -1.1677
   -1.2308




rint =


   -3.6258    6.5431
   -3.6258    6.5431
   -8.8608    2.3975
   -8.8608    2.3975
   -8.0537    3.8383
   -2.5588    8.5933
   -3.4191    8.4540
   -3.4191    8.4540
   -5.8066    3.4711
   -6.6867    4.2251




stats =


    0.9957  803.0623    0.0000    7.7489


从上表可以看出: 2 R 、F 值明显增大,p远小于 0.05,且每个回归系

数的置信区间没有包含零点,说明该模型拟合效果更好,其预测方程的关系式为: M=5561.2+0.3L-79.1L^2






    

猜你喜欢

转载自blog.csdn.net/suxiaorui/article/details/79904332