R语言什么鬼?可以用来做什么?和大数据又有什么关系?有没有好的课程推荐啊?学大数据一定要懂R语言么?……
网络上太多类似的问题,如果恰好你也有类似的疑惑,那么希望阅读本文之后你不再困惑~
〓R语言简介:
R是一套完整的数据处理、计算和制图软件系统。
其功能包括:
数据存储和处理系统;
数组运算工具(其向量、矩阵运算方面功能尤其强大);
完整连贯的统计分析工具;
优秀的统计制图功能;
简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。
R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个。例如用于经济计量、财经分析、人文科学研究以及人工智能。
R的思想是:
它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。
〓R语言可以用来做什么?
1、R主要擅长统计分析方面工作
R最初是由两位统计学家开发的,其主要优势也在于统计分析方面。它提供了各种各样的数据处理和分析技术,几乎任何数据分析过程都可以在R中完成。
与此相比较,SPSS、MINITAB、MATLAB等数据分析软件更加适合于已经处理好的、规范的数据,而对于还未完成处理过程,或者在分析中仍需大量与处理过程的数据而言,它们可能会显得繁琐一些。
2、R具有顶尖的绘图功能
尤其对于复杂数据的可视化问题,R的优势更加明显。
一方面,R中各种绘图函数和绘图参数的综合使用,可以得到各式各样的图形结果,无论对于常用的直方图、饼图、条形图等,还是复杂的组合图、地图、热图、动画,以及自己脑子里突然想到的其他图形展现方式,都可以采用R语言实现。
另一方面,从数值计算到得到图形结果的过程灵活,一旦程序写好后,如果需要修改数据或者调整图形,只需要修改几个参数或者直接替换原始数据即可,不用重复劳动。这对需要绘制大量同类图形的用户比较适用。
例如,某用户需要观察某一因素与其他100个因素的交互关系,可以绘制100个条形图或走势图。配合R的循环和条形图功能,可以很快得到jpg、png、bmp、tiff、gif或postscript等格式的图形结果。
3、R的交互式数据分析功能强大且灵活
一个完整的数据分析过程可以大体包括以下几个步骤:
(1)导入数据;
(2)数据准备、探索和清洗;
(3)拟合一个统计模型;
(4)得到结果并进行评估;
(5)如果结果的评估不理想,重新完成(3)步骤;
(6)得到多个模型的结果,并进行交叉检验;
(7)根据模型结果进行预测、分析等;
(8)形成报告。
R中每个步骤的所有“输出”都可以直接作为下一个步骤的“输入”,可以批量完成以上所有的(8)个步骤。
这个优点主要与STATA、SPSS等统计软件相比而言的,STATA和SPSS的统计分析结果是一大串图表或统计量。如果只是一个或少数几个步骤的分析,这种出现一大串结果的批处理更加直观方便。但如果分析中涉及很多连串的模型,而且一些模型需要反复调用前面模型的结果,那么R的灵活性会更加凸显。
4、R可以轻松地从多个数据源导入数据
包括文本文件、数据库、其他统计软件等。这一点很多其他软件还难以做到。
如readLines()、read.table()等函数可以导入文本数据,foreign包的read.spss()可以导入SPSS软件的sav格式数据,foreign包的read.dta()可以导入STATA软件的dta格式数据等等。
其他有关数据导入导出的函数可以参见R帮助文档《R Data Import/Export》。
〓R语言与大数据的关系
如果你对于R语言和大数据之间的关系不是太清楚,或者你有着“学大数据一定要懂R语言吗?”这样的疑惑,那么希望下图可以给你一下参考:
〓R语言课程
如果你想学R语言,可以通过以下基础课程来掌握,利用项目实战课程来了解R语言的用途以及使用方法。
基础入门:
-
【R语言入门】视频课程
R语言实战:
-
【R语言实战】
时间:4天现场+40节视频
授课方式:现场 +视频
授课地点:深圳
本课程结合大量的案例,让学习者可以快速掌握数据分析技能,并利用R实现各种数据挖掘模型的建立。
培训介绍:http://www.ppvke.com/class/detailcontent/?hid=340&tid=100074
项目实战:
-
【R语言数据挖掘实战】
时间:18天 4天理论、4天工具(R)、10天案例
授课方式:现场
授课地点:广州
课程偏重于从基础到实践,通过案例分析了解各个工具的应用,数据分析流程,数据挖掘流程,建模等等。适合于积累项目经验,便于就业快速上手。
培训介绍:http://www.ppvke.com/Answer/?/page/rencaijihua
课程咨询 与报名方式:
QQ:800098648
电话:400-070-7620
1、回复“数据分析师”查看数据分析师系列文章
2、回复“案例”查看大数据案例系列文章
3、回复“征信”查看相关征信的系列文章
4、回复“可视化”查看可视化专题系列文章
5、回复“SPPS”查看SPSS系列文章
6、回复“答案”查看hadoop面试题题目及答案
7、回复“爱情”查看大数据与爱情的故事
8、回复“笑话”查看大数据系列笑话
9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载
原文始发于微信公众号(PPV课数据科学社区):R语言什么鬼??你知道吗?
原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/19160