一、R语言介绍
1、免费的统计软件。 具有顶尖的统计功能。其他统计软件多多少少会收费。
课程大纲
1、什么是数据?
通常数据被认为是狭义上的数字,现在数字的含义被拓宽了,不仅是数字,也可以是字符、字母或者是文字。
比如:天气,食谱,等等。
2、数据分析
(1)分析商品的价格走势,从而做出预判,进一步进行选择。
(2)数据分析的过程:
数据采集:APP偷偷采集网页浏览记录。有的安卓 app 手电筒也要访问通讯录的权限。
数据存储:通常将数据存储在文件当中,R语言也是通过读写文件来进行操作。更加庞大的数据需要借助数据库来进行存储。
数据统计:有目的的进行数据统计,算盘,excel ,等等。操作对象是已知的数据。(比如对已知的数据进行求平均数,求中位数,求众数等等)
数据挖掘:Data Mining,又称作资料勘探、数据采矿。一般是指从大量数据当中,通过算法来探索未知的数据。
数据可视化:将数据变为图形,转化为方便人们理解的方式。
3、R语言介绍
- R语言的起源
s语言——> S-PLUS商业软件,收费。
而R语言免费。所以和 linux 和 unix 的关系相似。
- R语言的特点
4、R软件的安装
- windows下安装
(1)百度搜索 CRAN
(2)点击mirror (镜像),选择镜像
(3)找到中国:选择一个离自己比较近的地区
(4)点击 windows 下载
(5)点击 Base
(6)直接点击下载即可
- linux系统当中的安装(回头自己教程——bilibili 基因学苑)
5、R软件的运行与设置
1、配置文件的修改(在R软件启动的时候会先调用该文件配置)
2、添加两个函数
6、R-studio
为什么需要 R-studio ?
因为R软件使用起来不太方便。
具体可以参考这个博客。
注意:
(1)在安装 R-studio 之前必须提前安装 R软件
(2)要注意 R-studio 和 R软件必须放在同一个目录下
- 基本介绍
(1)界面介绍
(2)运行:
rum : 运行一行代码,要想运行全部代码,必须将代码全选。
re-run: 重复运行
Source:直接可以全部运行,可以选择打印或者不打印运行过程
(3)查找和代码纠错
(4)在控制台当中,使用 TAB 键可以一键补齐函数(不可以连续按 TAB 键)。这里还有对应函数的一些信息
内置数据集:是粉色的
数据框:是一个表格
函数:是蓝色的
(5)环境窗口:可以记录每个变量的值
(6)历史:可以记录我们之前敲过的代码
(7)图形展示区
(8)快捷键:
使用 Alt + shift + K 键可以显示所有的快捷方式
ctrl + 上箭头 : 可以列出历史记录