线性回归模型
线性回归模型的计算
#lm()可以完成多元线性回归函数的估计,回归系统与回归方程的检验的工作
#summary()函数,返回列表内容
#X1表示体重,x2表示年龄,Y表示对应体重与年龄下的血压
blood<-data.frame(
X1=c(76.0, 91.5, 85.5, 82.5, 79.0, 80.5, 74.5,
79.0, 85.0, 76.5, 82.0, 95.0, 92.5),
X2=c(50, 20, 20, 30, 30, 50, 60, 50, 40, 55,
40, 40, 20),
Y= c(120, 141, 124, 126, 117, 125, 123, 125,
132, 123, 132, 155, 147)
)
lm.sol<-lm(Y ~ 1+X1+X2, data=blood)#1表示常数项
summary(lm.sol)
call:
lm(formula = Y ~ 1 + X1 + X2, data = blood)
Residuals:
Min 1Q Median 3Q Max
-4.0404 -1.0183 0.4640 0.6908 4.3274
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -62.96336 16.99976 -3.704 0.004083 **
X1 2.13656 0.17534 12.185 2.53e-07 ***
X2 0.40022 0.08321 4.810 0.000713 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.854 on 10 degrees of freedom
Multiple R-squared: 0.9461, Adjusted R-squared: 0.9354
F-statistic: 87.84 on 2 and 10 DF, p-value: 4.531e-07
总结
#lm()可以完成多元线性回归函数的估计,回归系统与回归方程的检验的工作
#summary()函数,返回列表内容
#X1表示体重,x2表示年龄,Y表示对应体重与年龄下的血压
blood<-data.frame(
X1=c(76.0, 91.5, 85.5, 82.5, 79.0, 80.5, 74.5,
79.0, 85.0, 76.5, 82.0, 95.0, 92.5),
X2=c(50, 20, 20, 30, 30, 50, 60, 50, 40, 55,
40, 40, 20),
Y= c(120, 141, 124, 126, 117, 125, 123, 125,
132, 123, 132, 155, 147)
)
lm.sol<-lm(Y ~ 1+X1+X2, data=blood)#1表示常数项
summary(lm.sol)
call:
lm(formula = Y ~ 1 + X1 + X2, data = blood)
Residuals:
Min 1Q Median 3Q Max
-4.0404 -1.0183 0.4640 0.6908 4.3274
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -62.96336 16.99976 -3.704 0.004083 **
X1 2.13656 0.17534 12.185 2.53e-07 ***
X2 0.40022 0.08321 4.810 0.000713 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.854 on 10 degrees of freedom
Multiple R-squared: 0.9461, Adjusted R-squared: 0.9354
F-statistic: 87.84 on 2 and 10 DF, p-value: 4.531e-07
总结
1.call:为函数所使用的模型
2.residuals:残差,列出了最小值,1/4,中位数,3/4,最大值。
3.coefficients:系数,Estimate表示估计值(截距,x1,x2系数),3.1.std.error表示各个估计值的标准差
3.2.t value表示t统计值
3.3.Pr(>|t|)表示对应统计量的p值
3.4.Signif. codes:显著性检测,p值在那个区间就用对应的星号表
4.Residal standard error表示残差的标准差,自由度为n-p-1
5.Multiple R-Squared 表示相关系数的平方,R^2
6.Adjusted R-Squared 表示修正相关系数平方,这个值小于R^2,其目的是不要轻易做出自变量与因变量相关的判断。消除了R平方对自变量个数的依赖。
7.F-statistic 表示F统计量,自由度为(p,n-p-1),p-value表示F统计量对应的p值
Y = -62.96 +2.136*X1 + 0.4002*X2



