课程基本信息
标题:《R语言实战》直播课程周期:4天 上课方式:直播上课时间:2016年1月16-17日、23-24日 9:00-12:00 14:00-17:30
备注:提供课程讲义和全部代码、上课视频,以及赠送R进阶视频课程《机器学习与R语言实践》
学习目标
本课程结合大量的案例,让学习者可以快速掌握数据挖掘算法的核心原理,并利用R实现各种算法,并对模型性能进行评估。学习完本课程,学习者能达到以下目标:
1)熟悉各种常用数据挖掘算法的基本原理;
2)掌握用R进行数学建模的能力;
3)掌握模型性能评价的常用方法;
4)掌握Rattle工具的使用。
学习对象
统计学、数学、金融、计算机等相关专业学生或有一定统计分析、数据分析基础的从业人员
讲师介绍
谢老师:从事数据分析挖掘工作超过8年,从事过咨询、电商、电购、电力、游戏等行业,了解不同领域的数据特点。精通Excel、SpssClementine、SAS、R等多种数据分析挖掘工具。目前就职于一家上市游戏公司的高级数据分析师,主要利用R语言进行大数据的分析挖掘工作。有丰富的利用R语言进行数据分析挖掘实战经验,部分研究成果曾获得国家专利。
学习内容
Day1:统计模型
1) R语言介绍
2) 数据结构
3) 数据的导入导出
4) 基本数据管理
5) 控制流
Day 2:基础统计与统计绘图
1) 描述统计量
2) 描述性统计分析
3) R语言的绘图基础
4) 低级绘图函数
5) 高级绘图函数
Day 3:统计模型
1) 一元线性回归模型
案例:对women数据集进行线性回归建模
2) 多元线性回归模型:模型实现、模型检验、变量选择
案例:以state.x77数据集为例,探究一个州的犯罪率和其他因素的关系
3) logit回归模型
4) 降维技术:主成分分析、因子分析、对应分析
案例一:对调研的中学生身体指标进行主成分分析
案例二:利用主成分分析构建股票市场指数
案例三:对洛杉矶街区数据进行因子分析
5) 聚类分析
案例一:对iris数据集进行 k-means、k-medoids聚类
案例二:对洛杉矶街区数据进行层次聚类
6) 关联规则分析
案例:利用超市购物篮Groceries数据进行关联规则分析
Day 4:数据挖掘与文本挖掘
1) 使用最近邻近法分类
案例一:对iris数据集进行knn分类
案例二:对wisc_bc_data数据集进行knn分类
2) 朴素贝叶斯分类
案例一:对数据集PimaIndiansDiabetes进行分类;
案例二:利用朴素贝叶斯分类对文本数据进行分类;
3) 应用决策树进行分类
案例:对iris数据集进行C4.5、C5.0、CART等决策树分类
4) 神经网络及支持向量机
案例一:利用神经网络对 Vehicle数据进行分析
案例二:利用支持向量机对cats数据集进行分析,将尝试使
用体重和心脏重量来预测一只猫的性别。
5) 文本挖掘
案例:对推特数据进行文本挖掘
原文始发于微信公众号(PPV课数据科学社区):【直播培训】R语言实战 丰富的案例实操 1月16-17、30-31日
原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/17133