Tagged: R语言

第十一届中国R会议(广州)暨华南地区数据科学会议 (附嘉宾资料)

第十一届中国R语言会议(广州)暨华南地区数据科学会议于2018年11月24-25日在中山大学梁銶琚堂成功召开,本次会议累计共吸引了来自300家企事业单位、100多家高校与研究机构的近800位数据科学爱好者前来参会,一天半的12场主题演讲涵盖数据可视化、金融大数据、机器学习算法示例、R语言应用拓展等众多领域,同时Tutorial分会场也为广大数据科学爱好者们提供了一个更好地实践操作、交流和学习的平台。

R语言与机器学习(分类算法)支持向量机

说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道不得”。不过我还是打算写写SVM的基本想法与lib …

R语言画曲线图

本文以1950年到2010年期间我国的火灾统计数据为例,数据如下所示:

从0到1掌握R语言网络爬虫

我相信本文会让你对利用R爬取网页有一定了解,你对采集数据过程中可能遇到的问题也有所涉猎了。由于网页上的大部分数据是非结构化的,爬虫真的是非常重要的一项技能。

R语言简介

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

跟我学R爬虫|HTML基础与R语言解析

在众多的数据科学与网络技术中,louwill越来越发现大家对爬虫的兴趣要大于其他技术。微信上经常跑过来问我爬虫问题的同学不在少数,每次的问题除了具体的某个技术细节外,无外乎这个爬虫需求能否用R实现,那个爬虫操作能否用R搞定之类。每次碰到自己不能解决的,就只好说抱歉啊同学,你这个爬虫需求好像R爬虫不能解决哦,要不要用一下Python呢。

逻辑回归模型预测股票涨跌

R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Square)回归模型章节来总结一下,诊断多元线性回归模型的操作分析步骤。

作者:真依然很拉风
链接:http://www.jianshu.com/p/4c6c8174f292
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

R做多元线性回归全攻略

R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Square)回归模型章节来总结一下,诊断多元线性回归模型的操作分析步骤

作者:真依然很拉风
链接:http://www.jianshu.com/p/4c6c8174f292
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

R语言手册

在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built based on S language.)。

基于R语言的数据分析和挖掘方法总结——中位数检验

此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilcoxon符号秩 (signed-rank)检验,当数据中仅有单一组样本时,可用这种方法检验数据的中位数是否大于、小于或等于某一特定数值。

基于R语言的数据分析和挖掘方法总结——均值检验

t检验是一种检验总体均值的统计方法,当数据中仅含单组样本且样本数较大时(通常样本个数≧30的样本可视为样本数较大),可用这种方法来检验总体均值是否大于、小于或等于某一特定数值。

基于R语言的主成分和因子分析

主成分分析,是一种降维的分析方法,其考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

朴素贝叶斯分类器及R语言实现

朴素贝叶斯算法仍然是流行的十大挖掘算法之一,该算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。接下来我们就详细介绍该算法的知识点及实际应用。

Rattle:R语言数据挖掘的界面化工具

R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。

利用R语言对游戏用户进行深度挖掘

随着游戏市场竞争的日趋激烈,在如何获得更大收益延长游戏周期的问题上,越来越多的手机游戏开发公司开始选择借助大数据,以便挖掘更多更细的用户群、了解用户习惯来进行精细化、个性化的运营。

手把手教你做客户价值分群-R语言

当前各企业对客户关系管理(CRM)显得尤为关注,只有不断地保留并增加老客户黏性及挖掘潜客新客户,才能使企业生存的更好,更久。说到CRM,我刚开始接触的就是RFM模型,通过该模型将客户分为高价值、潜在价值和低价值。当每一个用户打上不同的价值标签时,就可以有针对性的实施营销策略,将有限的资源投入到高价值客户中,产生最大的利润。有关RFM模型,曾写过一篇实战: RFM模型使用(可点击查看)。

Eric Raymond 对于几大开发语言的评价

下面对几大开发语言的评价非常中肯,是我近年来看到的比较出色的评论。特别是他评价中抱有的那种“简单就是好”的思想,很值得我们深思。我特别选译出一些段落,供大家阅读思考。

R语言学习路线图及R数据挖掘包

对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?

切换注册

登录

忘记密码 ?

切换登录

注册