数据是信息时代的“新能源”。从金融到零售,从电商到体育,数据科学都成为成功决策的基础,广泛应用在营销优化、风险控制、客户关系等商业领域。 【CDA数据分析师周末集训-R语言】以CDA数据分析师标准大纲要求从数据库管理(Mysql)—统计理论方法—数据分析软件应用(R)—数据挖掘和机器学习(R)—数据可视化(ggplot,echartr等)整套数据分析流程技术系统讲解,还将结合量化投资、金融、银行、电信等行业真实需求出发全部用实际案例教学来使所学项目课程更能符合企业要求。 本课程针对周末时间充裕、基础薄弱;专科本科在校生;客户经理、产品经理、市场营销等岗位欲提升职业技能人员;待业、期待转行从事数据分析工作人员等提供3个月周末非脱产集训课程,毕业后对有工作需求的学员可推荐单位就业。
深圳:2018.12.1~2019.3 第一阶段:R语言编程基础与描述性分析
1.数据分析的武器库 2.数据分析工具R介绍 3.R的基本数据类型 4.R的基本数据结构 5.R的程序控制 6.R的函数与模块 7.R的日期与时间数据类型 8.在R语言中读写数据 9.描述性统计分析概述 10.统计制图的步骤 11.R语言基础绘图包 12.使用ggplot2绘图与可视化
第二阶段:Mysql数据库基础 1.Mysql数据库知识介绍 2.Mysql数据库的基本操作 3.Mysql数据表的基本操作 4.数据类型和约束条件 5.数据的CRUD操作之增加、删除、修改数据表 6.SQL数据库单表查询和联合查询 7.SQL操作符和函数 8.SQL综合案例:彩票数据核对练习 9.SQL综合案例:电商数据查询练习
第三阶段:数据分析之统计学基础 1.数据分析行业与知识简介 2.概率论基础知识 3.描述性统计分析 4.统计量与抽样分布 5.参数估计:点估计和区间估计 6.假设检验方法 7.方差分析的基本原理和操作
第四阶段:R语言进行数据清洗与统计分析 1.数据整合:SQL操作、R数据整合、数据横向合并与纵向合并 2.R中的高级数据整合:数据重组与转换、拆分/聚合列、堆叠列、分割列 3.R中的抽样:简单随机抽样、分层抽样、系统抽样、多阶段抽样 4.R的数据清洗:错误值处理、缺失值处理、噪声值处理 5.R语言实现统计检验与单样本T检验 6.R语言实现双样本T检验 7.R语言实现方差分析 8.R语言实现相关分析 9.R语言实现列联表分析与卡方检验 10.案例:银行业 – 月均信用卡支出数据集 11.案例:汽车业 – 汽车贷款违约数据集
第五阶段:R语言进行统计建模分析 1.简单线性回归与多元线性回归 2.多元线性回归的变量筛选 3.线性回归诊断方法- 残差分析、强影响点分析、多重共线性分析 4.正则化方法 – 岭回归和LASSO回归 5.Logistic回归的相关关系分析 6.Logistic回归模型及实现 7.Logistic回归的极大似然估计 8.Logistic回归模型评估方法 – ROC曲线 9.案例:银行业 – 月均信用卡支出数据集 10.案例:汽车业 – 汽车贷款违约数据集 11.维度规约方法概述 12.主成分分析与因子分析方法 13.奇异值分解 14.对应分析和多维尺度分析 15.案例:城市经济发展水平数据集 16.案例:电商购物信息数据集
第六阶段:R语言进行时间序列和综合案例分析 1.简单时间序列分析法:平滑算法 2.平稳时间序列(ARMA)模型设定与识别 3.非平稳时间序列(ARIMA)模型 4.时间序列建模步骤 5.综合案例:使用R语言进行信用卡产能指标趋势预测与监控 6.综合案例:使用R语言进行电信公司离网用户预警
第七阶段:R语言数据可视化 1.绘图思想的基本原理 2.R语言数据可视化包-GGplot2包介绍与图形绘制 3.R语言数据可视化包-Lattice包与GGvis包介绍与图形绘制 4.R语言数据可视化包-EchartsR介绍与图形绘制 5.分析结果展示与报告展现
第八阶段:期中项目作业与答辩 1.课题1:电商客户价值预测 2.课题2:网站流量数据分析 3.课题3:信用卡客户流失预警 4.课题4:银行电话营销响应分析 5.以上课题仅供参考
第九阶段:R语言数据挖掘与预测型数据挖掘模型Part1 1.数据挖掘概要 2.数据挖掘的方法和原理 3.数据挖掘基础和进阶技术概述 4.数据预处理技术:字段选择-数据清洗-字段扩充-数据编码 5.人工特征工程:特征构造 – 特征抽取 – 特征选择 6.决策树建模思路 7.Quinlan系列决策树(ID3、C4.5、C8.0)建模原理 8.CART建模原理 9.决策树模型修剪 10.决策树模型效果评估 11.案例:使用决策树进行初始信用评级
第十阶段:R语言预测型数据挖掘模型Part2 1.了解神经网络的基本概念 2.明确人工神经网络结构 3.神经元模型 4.掌握BP神经网络学习算法 5.多层感知器的R语言代码实现 6.贝叶斯公式与分类原理 7.朴素贝叶斯的参数估计 8.在R语言中实现朴素贝叶斯 9.KNN算法原理与R实现 10.线性可分与线性不可分 11.线性可分的支持向量机 12.线性支持向量机与软间隔最大化 13.非线性支持向量机与核函数 14.集成学习方法:Bagging、Boosting、随机森林
第十一阶段:R语言进行描述性数据挖掘模型 1.聚类算法的概述 2.聚类算法基本概念 3.聚类模型的评估 4.层次聚类原理与R实现 5.基于划分的聚类K-means的原理及应用 6.详谈基于密度的聚类方法与在R语言中的实现 7.案例:通信客户业务使用偏好聚类 8.关联规则的一些基本概念 9.关联规则Ariori算法的原理与R语言实现 10.关联规则FP-growth算法 11.序列模式的简介与概念 12.序列模式AprioriAll算法与R语言实现 13.基于用户和商品的的协同过滤算法
第十二阶段:期末项目作业与答辩 1.课题1:银行客户聚类分析 2.课题2:房贷客户进件违约风险预测 3.课题3:零售业客户忠诚预测 4.课题4:电信业营销响应预测模型 5.以上课题仅供参考
咨询联系:
咨询电话: 江老师 13828892967
联系QQ: 149104196,或扫码添加PPV课助手“数据小咖”咨询和报名
原文始发于微信公众号(PPV课数据科学社区):CDA数据分析师认证培训-R语言-深圳周末班
原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/5315