+关注
R

R

统计学与R读书笔记 第六版pdf

电子书yucheng 回复了问题 • 9 人关注 • 7 个回复 • 2440 次浏览 • 1 天前 • 来自相关标签

统计学习导论-基于R应用 中文版电子书

电子书imhuster 回复了问题 • 2 人关注 • 1 个回复 • 187 次浏览 • 4 天前 • 来自相关标签

上百篇大数据、数据分析、数据挖掘电子书合辑免费下载!

电子书imhuster 回复了问题 • 167 人关注 • 45 个回复 • 30142 次浏览 • 4 天前 • 来自相关标签

R语言 Learning R (学习R语言)

电子书imhuster 回复了问题 • 9 人关注 • 7 个回复 • 2336 次浏览 • 4 天前 • 来自相关标签

R语言 ggplot2:数据分析与图形艺术

电子书imhuster 回复了问题 • 11 人关注 • 6 个回复 • 2347 次浏览 • 4 天前 • 来自相关标签

请问哪里有资料下载

问吧kxshmyt 回复了问题 • 2 人关注 • 1 个回复 • 39 次浏览 • 5 天前 源自: • 来自相关标签

R Cookbook

电子书Mrblue-Patrick 回复了问题 • 2 人关注 • 1 个回复 • 935 次浏览 • 2016-11-23 21:52 • 来自相关标签

《R IN A NUTSHELL》pdf

电子书Mrblue-Patrick 回复了问题 • 2 人关注 • 1 个回复 • 807 次浏览 • 2016-11-23 21:33 • 来自相关标签

R语言编程艺术

电子书Mrblue-Patrick 回复了问题 • 12 人关注 • 8 个回复 • 2439 次浏览 • 2016-11-23 21:13 • 来自相关标签

声音太小,口音太重,需要使出吃奶的力气才能听清听懂

回复

问吧桑之未落 发起了问题 • 1 人关注 • 0 个回复 • 34 次浏览 • 2016-11-21 22:41 源自: • 来自相关标签

《数据挖掘与R语言》

电子书时光缺口 回复了问题 • 15 人关注 • 7 个回复 • 2506 次浏览 • 2016-11-09 13:32 • 来自相关标签

老师讲课的ppt可以共享下吗

回复

问吧ghty56 发起了问题 • 1 人关注 • 0 个回复 • 70 次浏览 • 2016-10-30 18:29 源自: • 来自相关标签

《统计建模与R软件》pdf

电子书半夏锦年 回复了问题 • 3 人关注 • 1 个回复 • 1810 次浏览 • 2016-10-28 11:53 • 来自相关标签

R软件数据分析 pdf

电子书半夏锦年 回复了问题 • 12 人关注 • 7 个回复 • 2263 次浏览 • 2016-10-28 11:51 • 来自相关标签

R语言与统计建模

电子书半夏锦年 回复了问题 • 8 人关注 • 3 个回复 • 2594 次浏览 • 2016-10-28 11:39 • 来自相关标签

视频一直在加载,无法播放。

问吧PPV课 回复了问题 • 2 人关注 • 1 个回复 • 60 次浏览 • 2016-10-28 09:32 源自: • 来自相关标签

R语言经典入门 中文版pdf

电子书盈盈一水间 回复了问题 • 7 人关注 • 1 个回复 • 2964 次浏览 • 2016-10-24 19:29 • 来自相关标签

R导论中文版 pdf

电子书盈盈一水间 回复了问题 • 11 人关注 • 7 个回复 • 3033 次浏览 • 2016-10-24 19:27 • 来自相关标签

我想将这样的形式 1 2 GG TT CC AA 转换成这种形式 1 1 2 2 G G T T C C A A 即将一列转换成两列,请问该如何实现,谢谢!

问吧火星小月儿 回复了问题 • 3 人关注 • 2 个回复 • 292 次浏览 • 2016-10-12 21:49 源自: • 来自相关标签

3.1 Rgraph03a 无法播放,可否再上传下

问吧hcy 回复了问题 • 3 人关注 • 2 个回复 • 383 次浏览 • 2016-10-07 08:49 源自: • 来自相关标签

《R Graph Cookbook》

电子书qy_xu2013 回复了问题 • 6 人关注 • 2 个回复 • 1748 次浏览 • 2016-10-06 22:56 • 来自相关标签

A Handbook of Statistical Analyses Using R Second Edition

电子书qy_xu2013 回复了问题 • 4 人关注 • 3 个回复 • 906 次浏览 • 2016-10-06 22:55 • 来自相关标签

R语言初学者指南

电子书狮子的心 回复了问题 • 10 人关注 • 6 个回复 • 2275 次浏览 • 2016-09-25 17:10 • 来自相关标签

《R语言与网站分析》

电子书哥哥 回复了问题 • 16 人关注 • 9 个回复 • 2106 次浏览 • 2016-09-23 11:35 • 来自相关标签

《R语言数据操作》

电子书哥哥 回复了问题 • 5 人关注 • 3 个回复 • 1429 次浏览 • 2016-09-23 11:31 • 来自相关标签

dir.create()函数的文件夹mode问题

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 96 次浏览 • 2016-09-18 17:07 • 来自相关标签

R readLines()读入在EOL终止之前就停止

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 96 次浏览 • 2016-09-13 19:32 • 来自相关标签

wordcloud2可以做自定义云词么

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 94 次浏览 • 2016-09-12 20:40 • 来自相关标签

如何给R的list添加元素

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 189 次浏览 • 2016-09-07 16:31 • 来自相关标签

Data Mining Algorithms: Explained Using R

电子书axelzhangs 回复了问题 • 2 人关注 • 1 个回复 • 751 次浏览 • 2016-09-07 15:56 • 来自相关标签

《R in Acation》

电子书axelzhangs 回复了问题 • 8 人关注 • 3 个回复 • 2085 次浏览 • 2016-09-07 15:49 • 来自相关标签

R Tools for Visual Studio

回复

工具非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 382 次浏览 • 2016-09-04 23:25 • 来自相关标签

R语言switch()函数与 C类的异同

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 128 次浏览 • 2016-09-03 18:30 • 来自相关标签

R语言与统计分析 pdf

电子书冲四爷 回复了问题 • 3 人关注 • 1 个回复 • 2555 次浏览 • 2016-09-03 10:23 • 来自相关标签

R实践运用 pdf

电子书冲四爷 回复了问题 • 4 人关注 • 1 个回复 • 1757 次浏览 • 2016-09-03 10:23 • 来自相关标签

R矩阵存储

回复

问吧非洲鸡2号 回复了问题 • 1 人关注 • 1 个回复 • 115 次浏览 • 2016-09-02 18:56 • 来自相关标签

请问怎么将rmd格式转化为html?拜托请附上具体操作,小白,新手,感谢

问吧非洲鸡2号 回复了问题 • 2 人关注 • 1 个回复 • 113 次浏览 • 2016-09-01 18:07 • 来自相关标签

如何向一个字符串赋值呢?

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 113 次浏览 • 2016-09-01 17:58 • 来自相关标签

R为什么一些数值类型的数据,用unique不能完全去掉相同值

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 109 次浏览 • 2016-08-31 16:12 • 来自相关标签

R里面有什么包和python的re模块一样

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 102 次浏览 • 2016-08-30 17:00 • 来自相关标签

时间系列自回归

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 113 次浏览 • 2016-08-30 16:44 • 来自相关标签

如何去掉向量才x <- c("a",1,2,3,NA)中的非数字元素

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 107 次浏览 • 2016-08-29 14:19 • 来自相关标签

《R Graphs Cookbook》相关数据和代码

数据nullall 回复了问题 • 5 人关注 • 2 个回复 • 1027 次浏览 • 2016-08-26 19:58 • 来自相关标签

R语言书籍导读

文章来去之间_s 回复了问题 • 143 人关注 • 43 个回复 • 11533 次浏览 • 2016-08-24 00:37 • 来自相关标签

感谢!谁知道老师说的那本书传到哪里了,我记得说分享上来了

问吧royleo35 回复了问题 • 3 人关注 • 2 个回复 • 332 次浏览 • 2016-08-18 20:04 源自: • 来自相关标签

Rstudio

回复

工具非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 361 次浏览 • 2016-08-10 18:11 • 来自相关标签

请问第四章能免费看吗

问吧风追梦 回复了问题 • 6 人关注 • 5 个回复 • 657 次浏览 • 2016-08-09 14:31 源自: • 来自相关标签

为什么所有视频都看不了了?屏幕一片黑色。

问吧风追梦 回复了问题 • 4 人关注 • 3 个回复 • 276 次浏览 • 2016-08-09 14:31 • 来自相关标签

好书看不停——R语言实战提要

文斐 回复了问题 • 8 人关注 • 6 个回复 • 1498 次浏览 • 2016-08-09 09:58 • 来自相关标签

时间序列分析及应用:R语言 pdf

电子书benyun 回复了问题 • 9 人关注 • 6 个回复 • 4239 次浏览 • 2016-08-06 20:14 • 来自相关标签

条新动态, 点击查看
yinhongyi

yinhongyi 回答了问题 • 2014-08-12 15:52 • 1 个回复 不感兴趣

【R每日一贴】如何画茎叶图?

赞同来自:

陆勤说:茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主... 显示全部 »
陆勤说:茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
R中使用stem()函数画茎叶图。
> ?stem
> data <- c(18,12,12,22,34,8,7,10,36)
> stem(data)

The decimal point is 1 digit(s) to the right of the |

0 | 78
1 | 0228
2 | 2
3 | 46
说明:茎叶图优点,一是数据内容可以在茎叶图中找到;二是针对两位数来说方便记录和表示。茎叶图缺点,分析粗略,对差异不大的数据不易区分,表示两位以上的数据时不够方便。
**R语言学习路线和常用数据挖掘包**

对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文... 显示全部 »
**R语言学习路线和常用数据挖掘包**

对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问。有这种疑问的人有福了,因为笔者将根据自己的经历总结一下R语言书籍的学习路线图以使Ruser少走些弯路。

本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。

**1.初级入门**

《R语言实战》,这是高涛、肖楠等翻译的一本书详细全面介绍了入门、图形、统计、回归、方差、功效分析、广义线性模型、主成分、因子分析、缺失值处理等。除此之外,还可以去读刘思喆的《153分钟学会R》。这本书收集了R初学者提问频率最高的153个问题。为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题花费1分钟时间,全局下来也就是153分钟了

**2.高级入门**

读了上述书籍之后,你就可以去高级入门阶段了。这时候要读的书有两本很经典的。《Statistics with R》和《The R book》。之所以说这两本书高级,是因为这两本书已经不再限于R基础了,而是结合了数据分析的各种常见方法来写就的,比较系统的介绍了R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容,看完之后你会发现,哇,原来R能做的事情这么多,而且做起来是那么简洁。读到这里已经差不多了,剩下的估计就是你要专门攻读的某个方面内容了。下面大致说一说。

**3.绘图与可视化**

亚里斯多德说,“较其他感觉而言,人类更喜欢观看”。因此,绘图和可视化得到很多人的关注和重视。那么,如何学习R画图和数据可视化呢?再简单些,如何画直方图?如何往直方图上添加密度曲线呢?我想读完下面这几本书你就大致会明白了。

首先,画图入门可以读《R Graphics》,个人认为这本是比较经典的,全面介绍了R中绘图系统。该书对应的有一个网站,google之就可以了。更深入的可以读《Lattice:Multivariate Data Visualization with R》。上面这些都是比较普通的。当然,有比较文艺和优雅的——ggplot2系统,看《ggplot2:Elegant Graphics for Data Analysis》。还有数据挖掘方面的书:《Data Mining with Rattle and R》,主要是用Rattle软件,个人比较喜欢Rattle!当然,Rattle不是最好的,Rweka也很棒!再有就是交互图形的书了,著名的交互系统是ggobi,这个我已经喜欢两年多了,关于ggobi的书有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不过,也只是适宜入门,更多更全面的还是去ggobi的主页吧,上面有各种资料以及包的更新信息!

**4.计量经济学**

关于计量经济学,首先推荐一本很薄的小册子:《Econometrics In R》,做入门用。然后,是《Applied Econometrics with R》,该书对应的R包是AER,可以安装之后配合使用,效果甚佳。计量经济学中很大一部分是关于时间序列分析的,这一块内容在下面的地方说。

**5.时间序列分析**

时间序列书籍的书籍分两类,一种是比较普适的书籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码,该书有中文版。如果不想买的话,建议去作者主页直接下载,英文版其实读起来很简单。时间序列分析中有一大块儿是关于金融时间序列分析的。这方面比较流行的书有两本《Analysis of financial time series》,这本书的最初是用的S-plus代码,不过新版已经以R代码为主了。这本书适合有时间序列分析基础和金融基础的人来看,因为书中关于时间序列分析的理论以及各种金融知识讲解的不是特别清楚,将极值理论计算VaR的部分就比较难看懂。另外一个比较有意思的是Rmetrics推出的《TimeSeriesFAQ》,这本书是金融时间序列入门的东西,讲的很基础,但是很难懂。对应的中文版有《金融时间序列分析常见问题集》,当然,目前还没有发出来。经济领域的时间序列有一种特殊的情况叫协整,很多人很关注这方面的理论,关心这个的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最后,比较高级的一本书是关于小波分析的,看《Wavelet Methods in Statistics with R》。附加一点,关于时间序列聚类的书籍目前比较少见,是一个处女地,有志之士可以开垦之!

**6.金融**

金融的领域很广泛,如果是大金融的话,保险也要被纳入此间。用R做金融更多地需要掌握的是金融知识,只会数据分析技术意义寥寥。我觉得这些书对于懂金融、不同数据分析技术的人比较有用,只懂数据分析技术而不动金融知识的人看起来肯定如雾里看花,甚至有人会觉得金融分析比较低级。这方面比较经典的书籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融产品定价之类的常常要用到随机微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的书是关于这方面的内容的,有实例,内容还算详实!此外,是风险度量与管理类。比较经典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投资组合分析类和期权定价类可以分别看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。

**7.数据挖掘**

现在相关的书籍已经比较多了,可见<R语言经典书籍推荐>一文中推荐的几本书。

**8.附注**

很多书都已经有电子版。可以在一些群或 新浪爱问 csdn等里面去找。

与数据挖掘有关或者有帮助的R包和函数的集合。

**1、聚类**

常用的包: fpc,cluster,pvclust,mclust
基于划分的方法: kmeans, pam, pamk, clara
基于层次的方法: hclust, pvclust, agnes, diana
基于模型的方法: mclust
基于密度的方法: dbscan
基于画图的方法: plotcluster, plot.hclust
基于验证的方法: cluster.stats

**2、分类**

常用的包:
rpart,party,randomForest,rpartOrdinal,tree,marginTree,
maptree,survival
决策树: rpart, ctree
随机森林: cforest, randomForest
回归, Logistic回归, Poisson回归: glm, predict, residuals
生存分析: survfit, survdiff, coxph

**3、关联规则与频繁项集**

常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则
DRM:回归和分类数据的重复关联模型
APRIORI算法,广度RST算法:apriori, drm
ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat

**4、序列模式**

常用的包: arulesSequences
SPADE算法: cSPADE

**5、时间序列**

常用的包: timsac
时间序列构建函数: ts
成分分解: decomp, decompose, stl, tsr

**6、统计**

常用的包: Base R, nlme
方差分析: aov, anova
密度分析: density
假设检验: t.test, prop.test, anova, aov
线性混合模型:lme
主成分分析和因子分析:princomp

**7、图表**

条形图: barplot
饼图: pie
散点图: dotchart
直方图: hist
密度图: densityplot
蜡烛图, 箱形图 boxplot
QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
Bi-variate plot: coplot
树: rpart
Parallel coordinates: parallel, paracoor, parcoord
热图, contour: contour, filled.contour
其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,
assocplot, mosaicplot
保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png

**8、数据操作**

缺失值:na.omit
变量标准化:scale
变量转置:t
抽样:sample
堆栈:stack, unstack
其他:aggregate, merge, reshape

**9、与数据挖掘软件Weka做接口**

RWeka: 通过这个接口,可以在R中使用Weka的所有算法。

相关导读:R语言书籍导读http://www.ppvke.com/Answer/?/question/460
A360陆勤

A360陆勤 回答了问题 • 2015-01-30 10:14 • 8 个回复 不感兴趣

R CODE

赞同来自:

树叶,你好。
你先让上面的代码循环5次。你可以使用循环来实现。
一个参考代码如下
> veccombin <- NULL
> for(i in 1:5)
+ {
+ vec <- sample(1:100, 10)
+ vecc... 显示全部 »
树叶,你好。
你先让上面的代码循环5次。你可以使用循环来实现。
一个参考代码如下
> veccombin <- NULL
> for(i in 1:5)
+ {
+ vec <- sample(1:100, 10)
+ veccombin <- c(veccombin, vec)
+ }
> veccombin
[1] 48 79 6 63 70 87 96 75 88 42 5 45 61 63 44 36 84 62 53 93 11 79 24 33 69
[26] 59 18 50 2 41 97 33 63 45 76 3 21 84 35 26 2 70 94 100 75 45 16 61 55 9
> length(veccombin)
[1] 50
> vecunique <- unique(veccombin)
> vecunique
[1] 48 79 6 63 70 87 96 75 88 42 5 45 61 44 36 84 62 53 93 11 24 33 69 59 18
[26] 50 2 41 97 76 3 21 35 26 94 100 16 55 9
> length(vecunique)
[1] 39
visualmac1

visualmac1 回答了问题 • 2015-02-22 18:01 • 43 个回复 不感兴趣

R语言书籍导读

赞同来自:

谢谢分享,不过为什么不能下载呢?登录后点击下载任然需要再次登录?
朋友,你好。我成功登录后,选择自己感兴趣的内容实现下载,请重新尝试,祝好!PPV课对你有用,请推介给身边的朋友。
谢谢分享,不过为什么不能下载呢?登录后点击下载任然需要再次登录?
朋友,你好。我成功登录后,选择自己感兴趣的内容实现下载,请重新尝试,祝好!PPV课对你有用,请推介给身边的朋友。
朋友,你好。我刚才是用了我的**谷歌浏览器播放,一切正常。**
附图如下:

** 插入的附件 **


朋友,你可以重新打开观看,若是还有问题,请留言于我。
朋友,你好。我刚才是用了我的**谷歌浏览器播放,一切正常。**
附图如下:

** 插入的附件 **


朋友,你可以重新打开观看,若是还有问题,请留言于我。
如果区分了训练集和测试集,建模的时候是只利用训练集的数据来进行建模,在用测试集的数据来验证模型效果。
拿R语言来说,如果你定义了train data和test data,那么建模时只会利用train data的数据建模,等模型建立以后,会利用predict函数... 显示全部 »
如果区分了训练集和测试集,建模的时候是只利用训练集的数据来进行建模,在用测试集的数据来验证模型效果。
拿R语言来说,如果你定义了train data和test data,那么建模时只会利用train data的数据建模,等模型建立以后,会利用predict函数对test data进行预测,再对比实际值进行效果评估。
有些人的做法是将数据分成训练集、验证集和测试集,会在建模的时候利用验证集在建模的时候对模型进行调优。也就是通常所说的交叉验证(CV-验证)。
对于clementine工具不熟,不知道你那边是否也是可以分成三份,利用了训练集建模,验证集进行调优呢?
2015/03: 把我以前用python的一个项目用R 和Rcpp重写了。说实话Rcpp非常好用,完全省去了写wrapper这一步,效率大挺升。一些sugar function也用起来得心应手。但是R总体体验还是让我有很多顾虑,总感觉这是一个工具,而并不是一门... 显示全部 »
2015/03: 把我以前用python的一个项目用R 和Rcpp重写了。说实话Rcpp非常好用,完全省去了写wrapper这一步,效率大挺升。一些sugar function也用起来得心应手。但是R总体体验还是让我有很多顾虑,总感觉这是一个工具,而并不是一门语言。比如R没有lint这种神器,使得我debug时间花费很多。最致命的就是内存管理太差。这次我处理的数据有点大,binary file就有5.3G,就算学校server有64G内存,R还是没法把它一股脑装进内存(跟我用的io package也有关系)。最后我还是割成小份一点点算的。其主要原因就是R一般把int都当double,而且喜欢copy而不是reference。最后说一个小发现,用makeForkCluster的时候,如果你更新了一个function,最好重新makeForkCluster一下,确保所以cluster上的function都是最新的。否则出来的结果可能会诡异哦,而且debug半天才发现是function没有更新。

2015/02: 最近在重新考量R,学会了用Rcpp. Rcpp还是挺好写的.相比python 的ctypes 不用写wrapper了.性能也杠杠的. data.table的fread读数据也非常快. 看来下面这篇文章有点过时了.

2014/07: 错别字比较多,请谅解~

总的概括:R主要在学术界流行,python(numpy scipy)在工程方便比较实用。
R是S(Splus)的开源版本,或者下一代。发源地在新西兰奥克兰。这个软件的统计背景很浓烈。我这里浓烈的意思是,如果你不熟习统计知识(历史)的话,R的帮助文档看起来是很累的。由统计背景的人开发。R的维护组叫CRAN-R。在生物信息方便,有个叫bioconductor的组织,里面有很多生物信息方面可以用的软件包,他们有一套自己维护package系统。

Python是个综合语言(这里特指指CPython解释器),numpy scipy是数值计算的扩展包,pandas是主要用来做数据处理(numpy依赖),sympy做符号计算(类似mathematica?)此外还有一些不太成熟的包如sciki learn,statistical models。成熟度不如R。但是已经到了可用的水平了。是读计算机的人写的统计包。ipython 更新到1.0以后,功能基本完善,其notebook非常强大(感觉就像mathematica)而且还是基于web,在合作分享方面非常好用。

性能:
大家都说R慢,特别是CS的人。其实这里主要是两点:一个R里面数组的调用都是用复制的,二是Rscript慢。三是处理大数据慢。如果R用的好的话,R是不太慢的。具体来说就是Rscript用的少,多用命令,跑点小数据。这样的话,实际在跑的都是背后的fortran和C库。他们都有快二三十年历史了。可谓异常可靠,优化得不能再优化了(指单线程,如果去看源代码挥发先许多莫名的常数,永用了以后精度高速度快!)。比如一个自己编写一个R脚本,loop套loop的那种,那真是想死的心都会有。外加一点,R处理文本文件很慢!

Python归根揭底还是个有解释器的脚本语言,而且有致命伤——GIL,但python最难能可贵的就是它很容易变得更快。比如pypy,cython,或者直接ctypes挂C库。纯python写个原型,然后就开是不断的profiling和加速吧。很轻易可以达到和C一个数量级的速度,但是写程序、调试的时间少了很多。

并行计算:
R v15 之后有了自带的parallel包,用挺轻松的。不过其实就是不停的fork,或者mpi,内存消耗挺厉害的。parSapply,parApply什么的,真是很好用。

Python虽然有GIL——并行计算的死敌,但是有multiprocessing(fork依赖) ,是可以共享数据的什么的,估计内存消耗方面比R好点,数据零散的话overhead很多。到了MPI的话,mpi4py还是挺好用的。用cython的话结合openmp可以打破GIL,但是过程中不能调用python的对象。

学习曲线:假设什么编程都不会的同学。
R一开始还是很容易上手的,查到基本的命令,包,直接print一下就有结果了。但是如果要自己写算法、优化性能的时候,学习难度陡增。

Python么,挺好学的,绝大多数的帮助文档都比R好了许多。有些包用起来没R方便。总的来说深入吼R陡。

扩展资源:
基本上新的统计方法都会有R的package,安装实用都不麻烦。但是基本上都是搞统计的人写的计算机包。所以效能上可能有问好。比较出名的有两个包的管理网站,cran-r 和bioconductor。 所以搞生化的估计R用起来很方便。

python的统计计算包们比R少,多很年轻,还在不断的开发中。优于是计算机人写的统计包,用起来的时候要多涨个心眼。

画图:
R自带的那些工具就挺好用了,然后还有ggplot这种非常优美的得力工具。

python 有matplotlib,画出来效果感觉比R自带的好一些些,而且界面基于QT,跨平台支持。可能是R用得多了,pyplot用起来还是不太顺手,觉得其各个组建的统一性不高。

IDE:
Rstudio非常不错,提供类matlab环境。(用过vim-r-plugin,用过emacs + ess现在用vim。)

windows 下有python(x,y) 还有许多商业的工具。(本人现在的emacs环境还不是很顺手~)

建议:
如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。

要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。

ps:盲目地用R的包比盲目的地用python的包要更安全。起码R会把你指向一篇论文,而python只是指向一堆代码。R出问题了还有论文作者、审稿人陪葬。

题外话,个人经验:
• 我首先用python实现了一个统计方法,其中用到了ctypes,multiprocess。
• 之后一个项目要做方法比较,又用回R,发现一些bioconductor上的包已经默认用parallel了。(但那个包还是很慢,一下子把我所以线程都用掉了,导致整个电脑使用不能,看网页非常卡~)
• 后来用python pandas做了一些数据整理工作,类似数据库,两三个表来回查、匹配。感觉还是很方便的。虽然这些工作R也能做,但估计会慢点,毕竟几十万行的条目了。
• 整理好之后开始尝试用python matplotlib画图。pyplot作图的方式和R差异很大,R是一条命令画点东西,pylot是准备好了以后一起出来。pyplot的颜色选择有点蛋疼,默认颜色比较少,之后可用html的颜色,但是名字太长了~。pyplot 的legend比R 好用多了,算是半自动化了。pyplot画出来后可以自由拉升缩放,然后再保存为图片,这点比R好用多了。

来自知乎周则禹
一只鱼

一只鱼 回答了问题 • 2015-12-22 15:41 • 1 个回复 不感兴趣

R语言编程

赞同来自:

这样循环太耗资源还很难跑出来,我根据你的思路重新写了个脚本来实现,你可以体验下是否达到了你的需求:
a <- c(1:10)
veci <- matrix(0,5,5)
b <- sample(a,5)
c <- sort(b)
vec... 显示全部 »
这样循环太耗资源还很难跑出来,我根据你的思路重新写了个脚本来实现,你可以体验下是否达到了你的需求:
a <- c(1:10)
veci <- matrix(0,5,5)
b <- sample(a,5)
c <- sort(b)
veci[1,] <- c

for(i in 1:4){
d <- c(setdiff(a,veci[i,]),sample(veci[i,],2))
e <- sample(d,5)
veci[i+1,] <- e
i+1
}

veci
intersect(veci[1,],veci[2,])
intersect(veci[2,],veci[3,])
intersect(veci[3,],veci[4,])
intersect(veci[4,],veci[5,])

统计学与R读书笔记 第六版pdf

回复

电子书yucheng 回复了问题 • 9 人关注 • 7 个回复 • 2440 次浏览 • 1 天前 • 来自相关标签

统计学习导论-基于R应用 中文版电子书

回复

电子书imhuster 回复了问题 • 2 人关注 • 1 个回复 • 187 次浏览 • 4 天前 • 来自相关标签

上百篇大数据、数据分析、数据挖掘电子书合辑免费下载!

回复

电子书imhuster 回复了问题 • 167 人关注 • 45 个回复 • 30142 次浏览 • 4 天前 • 来自相关标签

R语言 Learning R (学习R语言)

回复

电子书imhuster 回复了问题 • 9 人关注 • 7 个回复 • 2336 次浏览 • 4 天前 • 来自相关标签

R语言 ggplot2:数据分析与图形艺术

回复

电子书imhuster 回复了问题 • 11 人关注 • 6 个回复 • 2347 次浏览 • 4 天前 • 来自相关标签

请问哪里有资料下载

回复

问吧kxshmyt 回复了问题 • 2 人关注 • 1 个回复 • 39 次浏览 • 5 天前 源自: • 来自相关标签

R Cookbook

回复

电子书Mrblue-Patrick 回复了问题 • 2 人关注 • 1 个回复 • 935 次浏览 • 2016-11-23 21:52 • 来自相关标签

《R IN A NUTSHELL》pdf

回复

电子书Mrblue-Patrick 回复了问题 • 2 人关注 • 1 个回复 • 807 次浏览 • 2016-11-23 21:33 • 来自相关标签

R语言编程艺术

回复

电子书Mrblue-Patrick 回复了问题 • 12 人关注 • 8 个回复 • 2439 次浏览 • 2016-11-23 21:13 • 来自相关标签

声音太小,口音太重,需要使出吃奶的力气才能听清听懂

回复

问吧桑之未落 发起了问题 • 1 人关注 • 0 个回复 • 34 次浏览 • 2016-11-21 22:41 源自: • 来自相关标签

《数据挖掘与R语言》

回复

电子书时光缺口 回复了问题 • 15 人关注 • 7 个回复 • 2506 次浏览 • 2016-11-09 13:32 • 来自相关标签

老师讲课的ppt可以共享下吗

回复

问吧ghty56 发起了问题 • 1 人关注 • 0 个回复 • 70 次浏览 • 2016-10-30 18:29 源自: • 来自相关标签

《统计建模与R软件》pdf

回复

电子书半夏锦年 回复了问题 • 3 人关注 • 1 个回复 • 1810 次浏览 • 2016-10-28 11:53 • 来自相关标签

R软件数据分析 pdf

回复

电子书半夏锦年 回复了问题 • 12 人关注 • 7 个回复 • 2263 次浏览 • 2016-10-28 11:51 • 来自相关标签

R语言与统计建模

回复

电子书半夏锦年 回复了问题 • 8 人关注 • 3 个回复 • 2594 次浏览 • 2016-10-28 11:39 • 来自相关标签

视频一直在加载,无法播放。

回复

问吧PPV课 回复了问题 • 2 人关注 • 1 个回复 • 60 次浏览 • 2016-10-28 09:32 源自: • 来自相关标签

R语言经典入门 中文版pdf

回复

电子书盈盈一水间 回复了问题 • 7 人关注 • 1 个回复 • 2964 次浏览 • 2016-10-24 19:29 • 来自相关标签

R导论中文版 pdf

回复

电子书盈盈一水间 回复了问题 • 11 人关注 • 7 个回复 • 3033 次浏览 • 2016-10-24 19:27 • 来自相关标签

我想将这样的形式 1 2 GG TT CC AA 转换成这种形式 1 1 2 2 G G T T C C A A 即将一列转换成两列,请问该如何实现,谢谢!

回复

问吧火星小月儿 回复了问题 • 3 人关注 • 2 个回复 • 292 次浏览 • 2016-10-12 21:49 源自: • 来自相关标签

3.1 Rgraph03a 无法播放,可否再上传下

回复

问吧hcy 回复了问题 • 3 人关注 • 2 个回复 • 383 次浏览 • 2016-10-07 08:49 源自: • 来自相关标签

《R Graph Cookbook》

回复

电子书qy_xu2013 回复了问题 • 6 人关注 • 2 个回复 • 1748 次浏览 • 2016-10-06 22:56 • 来自相关标签

A Handbook of Statistical Analyses Using R Second Edition

回复

电子书qy_xu2013 回复了问题 • 4 人关注 • 3 个回复 • 906 次浏览 • 2016-10-06 22:55 • 来自相关标签

R语言初学者指南

回复

电子书狮子的心 回复了问题 • 10 人关注 • 6 个回复 • 2275 次浏览 • 2016-09-25 17:10 • 来自相关标签

《R语言与网站分析》

回复

电子书哥哥 回复了问题 • 16 人关注 • 9 个回复 • 2106 次浏览 • 2016-09-23 11:35 • 来自相关标签

《R语言数据操作》

回复

电子书哥哥 回复了问题 • 5 人关注 • 3 个回复 • 1429 次浏览 • 2016-09-23 11:31 • 来自相关标签

dir.create()函数的文件夹mode问题

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 96 次浏览 • 2016-09-18 17:07 • 来自相关标签

R readLines()读入在EOL终止之前就停止

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 96 次浏览 • 2016-09-13 19:32 • 来自相关标签

wordcloud2可以做自定义云词么

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 94 次浏览 • 2016-09-12 20:40 • 来自相关标签

如何给R的list添加元素

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 189 次浏览 • 2016-09-07 16:31 • 来自相关标签

Data Mining Algorithms: Explained Using R

回复

电子书axelzhangs 回复了问题 • 2 人关注 • 1 个回复 • 751 次浏览 • 2016-09-07 15:56 • 来自相关标签

《R in Acation》

回复

电子书axelzhangs 回复了问题 • 8 人关注 • 3 个回复 • 2085 次浏览 • 2016-09-07 15:49 • 来自相关标签

R Tools for Visual Studio

回复

工具非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 382 次浏览 • 2016-09-04 23:25 • 来自相关标签

R语言switch()函数与 C类的异同

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 128 次浏览 • 2016-09-03 18:30 • 来自相关标签

R语言与统计分析 pdf

回复

电子书冲四爷 回复了问题 • 3 人关注 • 1 个回复 • 2555 次浏览 • 2016-09-03 10:23 • 来自相关标签

R实践运用 pdf

回复

电子书冲四爷 回复了问题 • 4 人关注 • 1 个回复 • 1757 次浏览 • 2016-09-03 10:23 • 来自相关标签

R矩阵存储

回复

问吧非洲鸡2号 回复了问题 • 1 人关注 • 1 个回复 • 115 次浏览 • 2016-09-02 18:56 • 来自相关标签

请问怎么将rmd格式转化为html?拜托请附上具体操作,小白,新手,感谢

回复

问吧非洲鸡2号 回复了问题 • 2 人关注 • 1 个回复 • 113 次浏览 • 2016-09-01 18:07 • 来自相关标签

如何向一个字符串赋值呢?

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 113 次浏览 • 2016-09-01 17:58 • 来自相关标签

R为什么一些数值类型的数据,用unique不能完全去掉相同值

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 109 次浏览 • 2016-08-31 16:12 • 来自相关标签

R里面有什么包和python的re模块一样

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 102 次浏览 • 2016-08-30 17:00 • 来自相关标签

时间系列自回归

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 113 次浏览 • 2016-08-30 16:44 • 来自相关标签

如何去掉向量才x <- c("a",1,2,3,NA)中的非数字元素

回复

问吧非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 107 次浏览 • 2016-08-29 14:19 • 来自相关标签

《R Graphs Cookbook》相关数据和代码

回复

数据nullall 回复了问题 • 5 人关注 • 2 个回复 • 1027 次浏览 • 2016-08-26 19:58 • 来自相关标签

R语言书籍导读

回复

文章来去之间_s 回复了问题 • 143 人关注 • 43 个回复 • 11533 次浏览 • 2016-08-24 00:37 • 来自相关标签

感谢!谁知道老师说的那本书传到哪里了,我记得说分享上来了

回复

问吧royleo35 回复了问题 • 3 人关注 • 2 个回复 • 332 次浏览 • 2016-08-18 20:04 源自: • 来自相关标签

Rstudio

回复

工具非洲鸡2号 发起了问题 • 1 人关注 • 0 个回复 • 361 次浏览 • 2016-08-10 18:11 • 来自相关标签

请问第四章能免费看吗

回复

问吧风追梦 回复了问题 • 6 人关注 • 5 个回复 • 657 次浏览 • 2016-08-09 14:31 源自: • 来自相关标签

为什么所有视频都看不了了?屏幕一片黑色。

回复

问吧风追梦 回复了问题 • 4 人关注 • 3 个回复 • 276 次浏览 • 2016-08-09 14:31 • 来自相关标签

好书看不停——R语言实战提要

回复

文斐 回复了问题 • 8 人关注 • 6 个回复 • 1498 次浏览 • 2016-08-09 09:58 • 来自相关标签

时间序列分析及应用:R语言 pdf

回复

电子书benyun 回复了问题 • 9 人关注 • 6 个回复 • 4239 次浏览 • 2016-08-06 20:14 • 来自相关标签

【R每日一贴】基本统计量计算

文章A360陆勤 发表了文章 • 0 个评论 • 670 次浏览 • 2014-12-04 05:34 • 来自相关标签


R具有非常强大的计算功能,R可以作为一个“大计算器”。基本统计量计算主要包括:均值计算、中位数计算、标准差计算、方差计算、协方差和相关系数计算。
R中如何完成上述计算,汇总如下。
基本统计量一:均值计算。使用mean()函数计算均值。
基本统计量二:中...
查看更多

【R每日一贴】R结果重用?

电子书A360陆勤 发表了文章 • 0 个评论 • 487 次浏览 • 2014-12-02 06:34 • 来自相关标签


R结果重用是指R的结果可以轻松保存,以作为进一步分析的输入信息,这是R的一个非常实用的特点,与其他统计软件(SAS,SPSS等)相对比,更能发现R对于结果处理的灵活性。
为了说明R结果重用这个命题,举例说明如下。
数据集:R自带的mtcars数据。
问...
查看更多

【R每日一贴】R对行和列求和?

A360陆勤 发表了文章 • 2 个评论 • 872 次浏览 • 2014-11-26 06:37 • 来自相关标签


问题描述:R对行和列求和?
解决方案:R使用rowSums函数对行求和,使用colSums函数对列求和。
举例说明
{{{

matrix1 <- matrix(1:4, nrow=2, ncol=2, dimnames...
查看更多

【R每日一贴】列表那些事(二)?

A360陆勤 发表了文章 • 0 个评论 • 493 次浏览 • 2014-10-17 07:00 • 来自相关标签


关于R列表,继续谈论它的事情。
事情三:删除列表元素。将NULL赋值给需要删除的元素,就实现从列表中删除元素。举例说明如下。
{{{

daxue <- list("清华大学", "广东科技学院", &qu...
查看更多

【R每日一贴】列表那些事(一)?

A360陆勤 发表了文章 • 0 个评论 • 427 次浏览 • 2014-09-14 10:01 • 来自相关标签


列表是R一种数据结构。
关于R列表,谈谈这些事。
事情一:列表创建。使用list()函数创建列表。举例说明如下。
{{{

lst1 <- list(0, 1, 360)
lst1
[[1]]
[1] 0
[[2]]
[1] ...
查看更多

【R语言读书会】《R实战》读书笔记(第一章)

可爱上大夫 发表了文章 • 0 个评论 • 592 次浏览 • 2014-07-19 09:42 • 来自相关标签


第一章 R简介

本章概要

1安装R

2理解R语言

3运行R程序

本章所介绍的内容概括如下。

一个典型的数据分析步骤如图1所示。

![](http://www.ppvke.com/Blog/wp-c ... im...
查看更多