【R语言学习笔记】2、R包的使用、结果的重用、R如何处理大数据

1、R的包(package)

  • 目前(2019.08.17)有超过14000多个称为包的用户贡献模块可供使用,可以从https://cran.r-project.org/web/packages/下载

  • R自带一系列默认包,(包括:base、datasets、graphics、methods等等),他们提供了种类繁多的默认函数和数据集。

  • 包的安装和使用

    • library()命令可查看当前环境下安装了哪些包。

    • help(package="包名")查看某个包的说明文档,如help(package="base")查看base包的说明文档

      • 若果是不存在的包,会提示no package named 包名 could be found
    • 安装新的包:install.packages("包名"),如安装car包:install.packages("car"),找到后会弹出能下载的地址,选择一个china的即可进行安装。

    • 使用新安装的包里的函数:首先要将包加载进来,命令是:library(包名),然后就能直接使用car中的函数了,如只用car包里的some函数:

> some
错误: 找不到对象'some'
> library(car)
载入需要的程辑包:carData
> some
function (x, ...) 
UseMethod("some")
<bytecode: 0x000000000b4da678>
<environment: namespace:car>
  • 对包进行更新:update.packages()对所有包进行更新。

2、R结果的重用

  • 输出mtcars数据集的前六条数据:head(mtcars)
> head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
  • 查看mpgwt之间的相关性,得到如下-5.344,呈负相关。
> lm(mpg~wt, data=mtcars)

Call:
lm(formula = mpg ~ wt, data = mtcars)

Coefficients:
(Intercept)           wt  
     37.285       -5.344  
  • result这个变量这个保存拟合回归模型,并对其进行重用,
> result <- lm(mpg~wt, data=mtcars)
> summary(result)

Call:
lm(formula = mpg ~ wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5432 -2.3647 -0.1252  1.4096  6.8727 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
wt           -5.3445     0.5591  -9.559 1.29e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.046 on 30 degrees of freedom
Multiple R-squared:  0.7528,    Adjusted R-squared:  0.7446 
F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10
  • 还能进行重用画图:plot(result)

3、R如何处理大数据

  • 专门的用于大数据的分析包,如lm()是做线性拟合的函数,而biglm()则能以内存高效的方式实现大型数据的线性模型拟合
  • R与大数据处理平台的结合,如RHadoopRHiveRhipe
    在这里插入图片描述
发布了44 篇原创文章 · 获赞 5 · 访问量 4499

猜你喜欢

转载自blog.csdn.net/ljb0077/article/details/99689949