Category: R语言

第十一届中国R会议(广州)暨华南地区数据科学会议 (附嘉宾资料)

第十一届中国R语言会议(广州)暨华南地区数据科学会议于2018年11月24-25日在中山大学梁銶琚堂成功召开,本次会议累计共吸引了来自300家企事业单位、100多家高校与研究机构的近800位数据科学爱好者前来参会,一天半的12场主题演讲涵盖数据可视化、金融大数据、机器学习算法示例、R语言应用拓展等众多领域,同时Tutorial分会场也为广大数据科学爱好者们提供了一个更好地实践操作、交流和学习的平台。

手把手 | 哇!用R也可以跑Python了

R还是Python? 真是个千古难题! 如果你主要从事数据分析、统计建模和可视化,R大概是你的不二之选。但如果你还想来搞点深度学习,整个自然语言处理,那你可还真得用Python。 如果你处于交叉领域,很可能就需要两种语言切换。

R语言与机器学习(分类算法)支持向量机

说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道不得”。不过我还是打算写写SVM的基本想法与lib …

R语言画曲线图

本文以1950年到2010年期间我国的火灾统计数据为例,数据如下所示:

R语言简介

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

跟我学R爬虫|HTML基础与R语言解析

在众多的数据科学与网络技术中,louwill越来越发现大家对爬虫的兴趣要大于其他技术。微信上经常跑过来问我爬虫问题的同学不在少数,每次的问题除了具体的某个技术细节外,无外乎这个爬虫需求能否用R实现,那个爬虫操作能否用R搞定之类。每次碰到自己不能解决的,就只好说抱歉啊同学,你这个爬虫需求好像R爬虫不能解决哦,要不要用一下Python呢。

逻辑回归模型预测股票涨跌

R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Square)回归模型章节来总结一下,诊断多元线性回归模型的操作分析步骤。

作者:真依然很拉风
链接:http://www.jianshu.com/p/4c6c8174f292
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

R做多元线性回归全攻略

R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and Statistical Inference的章节以及《R语言实战》的OLS(Ordinary Least Square)回归模型章节来总结一下,诊断多元线性回归模型的操作分析步骤

作者:真依然很拉风
链接:http://www.jianshu.com/p/4c6c8174f292
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

R语言手册

在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built based on S language.)。

基于R语言的数据分析和挖掘方法总结——中位数检验

此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilcoxon符号秩 (signed-rank)检验,当数据中仅有单一组样本时,可用这种方法检验数据的中位数是否大于、小于或等于某一特定数值。

基于R语言的数据分析和挖掘方法总结——均值检验

t检验是一种检验总体均值的统计方法,当数据中仅含单组样本且样本数较大时(通常样本个数≧30的样本可视为样本数较大),可用这种方法来检验总体均值是否大于、小于或等于某一特定数值。

我的Kaggle初体验 — Grupo Bimbo Inventory Demand

这个暑假利用在西班牙交流的时间,我开始着手做自己的第一个Kaggle比赛,总得感觉还是收获特别多,所以也希望和小伙伴分享自己的经验(编程、计算、模型、体验)。这次最终排名在11/1969,获得了一块金牌。

ggplot2又添新神器——ggthemr助你制作惊艳美图

今天在浏览ggplot扩展插件目录的时候,又发现了一款神器——ggthemr。

这是继ggplot2的ggtheme包、RColorBrewer包之后(不算ggtech和ggsci这两个小众包)第三款ggplot配色神器。

Learn R | Random Forest of Data Mining(上)

在使用随机森林算法进行R实现之前,我们有必要对该算法有着一个全面的认知与学习,本文将从以下几个方面详细介绍随机森林算法。

基于 R 语言和 SPSS 的决策树算法介绍及应用

本文介绍了机器学习的相关概念、常见的算法分类和决策树模型及应用。通过一个决策树案例,着重从特征选择、剪枝等方面描述决策树的构建,讨论并研究决策树模型评估准则。

R语言之控制流的使用方法

一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即

1)if或switch分支语句
2)for循环
3)while循环

基于R语言的主成分和因子分析

主成分分析,是一种降维的分析方法,其考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

切换注册

登录

忘记密码 ?

切换登录

注册