1. 首页
  2. 数据分析

R与数据分析学习总结之一:R语言基本操作

点击上方免费订阅学习)

R与数据分析学习总结之一:R语言基本操作

最近开始学习R语言,把学习笔记和小伙伴们分享一下吧,欢迎一起交流R与数据分析学习总结之一:R语言基本操作

R 起源:

R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业 软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。 R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。

R基本操作:

点开R语言就看到了如下操作界面,这也是我们和R语言内部算法交互的最主要途径。

R与数据分析学习总结之一:R语言基本操作

“>”类似于cmd下的录入提示符一样,我们可以从这里录入数据,进行数据处理等。首先我们先录入两个数组:x1= c(1 2 3 4 5)和x2=c(‘1’,‘2’,‘3’,‘4’,‘5’)其中“c()”是R语言的录入数组的函数,R语言每一行只能执行一个操作,录入x1后回车继续录入x2;录入完后,数据就存放于内存,后续只需调用x1标识符即可对数组(1,2,3,4,5)进行操作。

1、数组基本的操作:

1)、查看数组—直接调用数组名回车;

2)、按照下标获取数组元素—调用数组名+方括号+元素下标;

3)、查看数组长度(length());

4)、查看数组元素类型(mode(); ps:语言只支持数组元素单一类型,及所有元素要么都是字符,要么都是数值)

5)、对数组的操作还包括多个数组的包括,可以将两个数组组合成一个矩阵(R语言称之为数据框:frame),可以将数组按照行向量组合rbind()和列方向的组合cbind();

Ps:将字符类型数组和数值类型数组合并的结果是新的矩阵元素都为字符串类型;

具体的使用和输出如下:

R与数据分析学习总结之一:R语言基本操作

2、有关数组的统计指标处理:

常见的统计指标包括:平均值(mean())、求和(sum())、连乘(prod())、最值(min()、max())、方差(var())、标准差(sd())

首先我们先借助R的快速生成数组函数c(startNum:endNum)生成1到100个数字并存放于数组y内,然后对其进行相应统计指标输出,具体见下图:

R与数据分析学习总结之一:R语言基本操作

3、关于数据下标的相关处理

R语言提供了实用的下标处理函数,我们可以方便的取出理想数据,例如:

1)、取连续下标的元素;

2)、按照其他数组元素的值取—以其他数组元素的值取出相应本数组对应下标的元素;

3)、按照元素值的大小取,如可以去除数组中大于某个数的所有元素,小于某个数的所有元素等等;

4)、实用的which函数,which在数组下标中代表该数组对象,可以通过which取出数组元素a[which()],相应的也可以取出符合元素的下标which();

5)、自排序函数(sort())和数组反转函数(rev());

具体使用及输出如下:

R与数据分析学习总结之一:R语言基本操作

3、生成矩阵和矩阵操作相关函数:

R提供了数组转矩阵的函数(matrix()),矩阵是后续很多工作的开始:

1)、矩阵进行加减(+-)、相乘(%*%):

Ps:数组生成矩阵时,默认是按照列方向进行,可以加参数byrow=T,使其按行方向生成矩阵

R与数据分析学习总结之一:R语言基本操作

2)、取对角线(diag())、转置(t())

R与数据分析学习总结之一:R语言基本操作

3)、求逆(solve)、解线性方程组(solve):

R与数据分析学习总结之一:R语言基本操作

求特征值特征向量(eigen())

R与数据分析学习总结之一:R语言基本操作

R语言的基本数据结构—数据框

数据框也是矩阵形式,但不同于一般的矩阵,数控框中的列可以是不同的数据类型,每一列即为一个属性值,每一行即为条记录,或为一个对象的所有属性的观测值。

R与数据分析学习总结之一:R语言基本操作

R语言读取外部数据—文本数据:

R与数据分析学习总结之一:R语言基本操作

逻辑循环控制:

R语言支持for循环和while循环,两种循环结构上和通用编程语言类似,但有少数差异。

Ps: R中数组下标从1开始;R不支持“++”R与数据分析学习总结之一:R语言基本操作

R与数据分析学习总结之一:R语言基本操作

今天就贴到这啦,希望对小伙伴有帮助,下次换R语言之绘图篇。

PPV课转载的每一篇文章均来源于公开网络,仅供学习使用,不会用于任何商业用途,文章版权归原作者所有,如果侵犯到原作者的权益,请您与我们联系删除或者授权事宜,联系邮箱:149104196@qq.com。转载PPV课网站文章请注明原文章作者,否则产生的任何版权纠纷与PPV课无关。

PPV课-国内领先的大数据学习社区和职业培训平台

R与数据分析学习总结之一:R语言基本操作

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID:ppvke123(长按可复制)

本公众号专注大数据和数据科学领域,分享领域知识和相关技术文章,探索大数据商业价值,培养和挖掘大数据专业人才,欢迎大家关注!

原文始发于微信公众号(PPV课数据科学社区):R与数据分析学习总结之一:R语言基本操作

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/15183

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息