1、R的包(package)
-
目前(2019.08.17)有超过14000多个称为包的用户贡献模块可供使用,可以从https://cran.r-project.org/web/packages/下载
-
R自带一系列默认包,(包括:base、datasets、graphics、methods等等),他们提供了种类繁多的默认函数和数据集。
-
包的安装和使用
-
library()
命令可查看当前环境下安装了哪些包。 -
help(package="包名")
查看某个包的说明文档,如help(package="base")
查看base包的说明文档- 若果是不存在的包,会提示
no package named 包名 could be found
- 若果是不存在的包,会提示
-
安装新的包:
install.packages("包名")
,如安装car
包:install.packages("car")
,找到后会弹出能下载的地址,选择一个china的即可进行安装。 -
使用新安装的包里的函数:首先要将包加载进来,命令是:
library(包名)
,然后就能直接使用car
中的函数了,如只用car
包里的some
函数:
-
> some
错误: 找不到对象'some'
> library(car)
载入需要的程辑包:carData
> some
function (x, ...)
UseMethod("some")
<bytecode: 0x000000000b4da678>
<environment: namespace:car>
- 对包进行更新:
update.packages()
对所有包进行更新。
2、R结果的重用
- 输出
mtcars
数据集的前六条数据:head(mtcars)
:
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
- 查看
mpg
和wt
之间的相关性,得到如下-5.344,呈负相关。
> lm(mpg~wt, data=mtcars)
Call:
lm(formula = mpg ~ wt, data = mtcars)
Coefficients:
(Intercept) wt
37.285 -5.344
- 用
result
这个变量这个保存拟合回归模型,并对其进行重用,
> result <- lm(mpg~wt, data=mtcars)
> summary(result)
Call:
lm(formula = mpg ~ wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-4.5432 -2.3647 -0.1252 1.4096 6.8727
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
wt -5.3445 0.5591 -9.559 1.29e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.046 on 30 degrees of freedom
Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
- 还能进行重用画图:
plot(result)
3、R如何处理大数据
- 专门的用于大数据的分析包,如
lm()
是做线性拟合的函数,而biglm()
则能以内存高效的方式实现大型数据的线性模型拟合 - R与大数据处理平台的结合,如
RHadoop
、RHive
、Rhipe
等