概念:
当自变量有多个时,回归模型就变成了:
多元回归方程变为:
估计多元回归方程变为:
估计方法:
多元回归的求解比简单线性回归复杂但是思路是相同的,运用最小二乘法进行相应的求解,这里不再进行展开。
python实现的小例子:
问题:如故一个运输任务是跑102英里,运输了6次,预计多少小时?
from numpy import genfromtxt
from sklearn import linear_model
dataPath = r"Delivery.csv"
deliveryData = genfromtxt(dataPath,delimiter=',')
print ("data")
print (deliveryData)
x= deliveryData[:,:-1]
y = deliveryData[:,-1]
print (x)
print (y)
lr = linear_model.LinearRegression()
lr.fit(x, y)
print (lr)
print("coefficients:")
print (lr.coef_)
print("intercept:")
print (lr.intercept_)
xPredict = [[102,6],[103,7]]
yPredict = lr.predict(xPredict)
print("predict:")
print (yPredict)
Delivery.csv文件内容为:
结果:
注:如果自变量中有分类型变量,如何处理?
如车型为分类型变量把它转换为3列,相应的一列标为1,其他的标位0,再进行上述相同的运算。