1. 首页
  2. 数据挖掘

新书推荐① | 数据挖掘实用案例分析,内含赠书活动!

关键词:数据挖掘,数据分析、案例分析

本书结合项目实践,对数据挖掘的核心问题进行了总结,并以案例说明数据挖掘过程每个步骤需要关注之处;立足实际应用,突出实际数据分析项目中的思路,以及数据分析中的难点。

  • 《数据挖掘实用案例分析》

  • 赵卫东 董亮 著

  • 9787302490494

  • 定价:49元

内容摘要

数据挖掘已经广泛应用于各行各业,并催生了数据分析师的兴起。本书结合项目实践,首先对数据挖掘的核心问题进行了总结,并以保险推荐为例说明数据挖掘过程每个步骤需要关注之处。然后,结合香水销售分析,讨论可视化图形的基本应用,这是数据分析的基本功。为增强本书的实用性,提高动手能力,后续章节详细地分析了数据挖掘在银行信用卡、餐饮、商务酒店、制造业、公安等领域的应用。此外,还介绍了卷积神经网络在音频数据处理的实际应用。全书内容深入浅出,案例生动形象,可以作为高校相关专业数据挖掘、机器学习、商务数据分析等课程的实验教材,也可以供学习数据分析的社会人士参考。

前言

目前,高校的数据分析类课程(数据挖掘、机器学习、大数据分析等)教学方式大多以“知识点”为核心组织教学,学生主要以学习知识为主,工程应用实践机会较少。教师将所要教授的知识点在课堂上讲述,课后再以作业练习、课程实验、课程设计等形式帮助学生深入理解课堂上所学的知识。尽管为提高教学效果,目前许多高校尝试了MOOC课程、翻转课堂、移动课堂、同伴学习和SPOC等教学方法的改革,但总体上来说,对于应用性较强的课程教学还存在改进的空间,尤其是对学生的动手实践能力要求较高的数据分析类课程。现有的教学方法在传授理论知识时,缺少实际应用环节的支持,学生缺少在实际应用的背景下充分理解所学知识的机会,难以培养学生应用专业知识分析解决问题的技能和创新思维能力。

数据分析的方法是科学,但这些方法的选择和应用过程因问题而异,带有很强的艺术性。在现有专业课程教学模式下,学生仅仅了解需要学习基本的理论知识,缺少实践动手经历,难以获得这些知识的应用技巧,很少接触与企业实际项目相关的内容,因此学生的应用能力较弱,与企业实际的需求之间有很大的脱节。例如在数据分析课程中,一般的教学方式是教师将具体数据分析方法教授给学生,学生能够理解算法或方法的内容,但难以解决实际项目中应用具体算法碰到的问题。目前亟待克服数据分析类课程教学脱离企业所需能力的培养疼点,在课程中学习的知识基础上,解决实际问题,引导学生解决数据分析实际问题的必要技能和思维方法。

实际上,数据分析绝大部分的教材和书籍还基本停留在基本理论和方法的介绍,实验部分的内容比较简单或者缺失,实际应用的内容不足。还有些实战性的书籍没有按照教材的方式编写,案例也比较粗略,数据分析过程中的一些技能解释肤浅。有关实际项目中数据分析过程思路的分析以及难点解析对教学,尤其实验或案例教学非常重要。最近几年,作者与多家企业合作,在数据分析领域辛苦耕耘,亲自参与了多个实际数据分析项目,熟悉数据分析过程的酸甜苦辣,希望通过本教材弥补国内数据分析实用教材的不足,也希望本教材的出版将会改善国内数据分析类课程教学资料短缺的不足。

学习数据分析的最好方法就是做中学,使用实际数据解决实际问题,而不是单纯学习技术。实际上,有效的数据分析需要对业务进行深入的理解,在此基础上形成有效的分析思路,并通过实验反复比较,才能真正解决客户的问题。在数据时代,现实应用中往往不乏数据。从生活中的小数据、简单问题开始,做各种假设,探索其中的规律。不断尝试常用的分析语言、工具和技术,在应用中不断学习新的知识,弥补课堂教学的不足。尤其是体会数据分析过程中书本上难得看到的分析技巧,并在应用中举一反三。如此反复,随着分析问题的深入,不断提高分析能力,体会数据分析的艰辛和解决客户问题的快乐。

本教材不局限于数据分析基本理论和基本方法的介绍,而是立足实际应用,突出实际数据分析项目中的思路,以及数据分析中的难点。但希望读者具有一定的统计学、机器学习(数据挖掘)、数据科学以及必要的相关专业知识。也不追求过多的案例堆积,希望读者能理解数据分析的思路,举一反三。这些内容是作者多年项目实践和教学成果的总结,其中的分析思路只有参与实际的项目才能体验到数据分析的难点和艺术性,这是目前教学过程中培养学生工程性思维的重要问题,也是真正提高学生创新能力和动手能力的手段。这些内容是数据分析的基础,也是从事大数据分析必要掌握的知识和技能。有关数据挖掘常用算法的介绍,读者可以参阅作者已经出版的教材《商务智能(第四版)》(清华大学出版社,2016年)或其他专业书籍。

本书分为11章,具体的内容简介如下:

第一章从数据分析的流程出发,讨论了在数据分析各个阶段需要做的工作以及经常遇到的主要问题,尤其是数据挖掘算法使用时容易遇到的难题。数据挖掘过程有一定的标准,但是针对具体的业务需求,如何设计合理、有效的数据分析流程,需要有一定的经验和技巧,数据的预处理、算法的选择等主要步骤都充分体现了数据挖掘的艺术性。

第二章以保险产品推荐项目为例,突出了数据挖掘选择合适的算法并非很简单的事情,需要在理解分析问题以及对多种算法熟悉的基础上,通过实验对初选的几种算法进行比较、调优,才能选择对解决问题效果比较好的算法。

第三章介绍了多维分析常用的可视化图形,这是数据分析的基本功。这些图形可以帮助数据分析师探索数据,找出数据中存在的问题以及基本规律。

第四章介绍了IBM SPSS Modeler 18数据挖掘工具的常用组件。在学习数据分析的不同阶段,根据学习者的基础、问题的分析难度等,可以选择不同的工具或平台。尽管分析工具并不是数据挖掘最重要的事情,但学习成本低、功能强大的分析工具对于问题的解决也是不可少。对于编程基础有限的数据分析师,可以选择类似IBM SPSS Modeler 18的挖掘工具或TensorFlow等开源工具。尽管如此,对于有一定的数据分析基础的读者,我还推荐学习Python、R等针对数据分析的语言,这些语言比较灵活,功能也十分强大。

第五章对香水的销售数据进行分析,讨论受欢迎的香水以及特点,并找出影响香水销售的主要因素,为香水的营销提供依据。

第六章对银行的客户信用记录、申请客户信息、拖欠历史记录、消费历史记录等人口属性、交易数据等进行综合分析,讨论用户银行信用卡拖欠和欺诈行为特征,为银行推广信用卡以及风险管理提供依据。

第七章从大众点评网抓取火锅店海底捞的菜品介绍以及客户评论数据,以客户为中心,分析客户对火锅的偏好,为火锅店的选址、菜品的选择和设计以及火锅店的竞争力都提供了参考。

第八章以携程网上某商务酒店的客户评分、评论数据为基础,通过情感分析,分析了客户对商务旅馆的偏好,并了解客户的消费行为,比较多家商务旅馆的竞争优劣势,为商务旅馆改进经营提供了参考。

第九章在某耐热导线工厂最近2年的质量管理数据的基础上,分析了这些数据存在的问题,探索耐热导线的加工流程中几个工序之间半成品或成品质量指标应的关系,提高最终产品的合格率。

第十章利用公安人口数据和违法犯罪人员行为特点的数据,建立风险评分模型,实现对高危人群的特征分析,识别具有违法犯罪可疑或可能的高危人员。

第十一章讨论深度学习在音频处理领域的应用,介绍了常用的深度神经网络模型,重点分析卷积神经网络在音频质量进行评价的应用。

数据挖掘是一个多学科交叉的领域,本书通过少数实际的具体案例,阐述数据分析项目分析的过程以及一些要点,可作为普通高等学校数据挖掘、商务数据分析、商务智能等课程的案例和实验指导材料。也可供有志于数据分析师的读者参考。由于作者水平有限,书中难免之处,希望读者不吝指出。

作者简介

赵卫东,2001年4月毕业于东南大学,获博士学位。

2001年6月起在复旦大学管理科学与工程博士后流动站工作。2003年5月进入复旦大学软件学院,主要负责本科生和各类研究生电子商务、大数据核心技术和商务智能等课程的教学,2011年纽约大学Stern商学院访问学者。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括电子推荐、智能决策和大数据分析等。

主持国家自然科学基金2项、中国博士后科研基金、上海市浦江人才、IBM Shared University Research以及10项企业合作课题等项目。已在《管理科学学报》、《系统工程学报》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇,其中被SCI、EI收录40多篇。

出版专著《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能(第四版)》、《商务智能 数据分析的管理视角(第三版)》、《人机共生——优化商业决策之路》、《机器学习》等10多部。获得上海市2015年上海市科技进步二等奖。

目录

第一章 数据分析过程的主要问题

1.1 业务理解

1.2 数据理解

1.3 数据质量问题与预处理

1.4 数据分析常见陷阱

1.5 数据分析方法的选择

1.4.1 分类算法

1.4.2 聚类算法

1.4.3 关联分析

1.4.4 回归分析

1.4.5 深度学习

1.4.6 统计方法

1.5 数据分析结果的评价

1.5.1 分类算法的评价

1.5.2 聚类结果的评价

1.5.3 关联分析的评价

1.5.4 回归分析结果的评价

1.5.5 深度学习的评价

1.6 数据分析团队的组建

1.6.1 项目经理

1.6.2 业务专家

1.6.3 数据工程师

1.6.4 数据建模人员

1.6.5 可视化人员

1.6.6 评估人员

1.7 数据分析人才培养的难题

1.7.1 数理要求高

1.7.2 跨学科综合能力

1.7.3 国内技术资料少

1.7.4 实践机会少

第二章数据挖掘算法的选择—保险产品推荐

2.1业务理解

2.2 数据分析目标

2.3 数据探索

2.3.1 数据质量评估

2.3.2 探索数据统计特性

2.3.3 数据降维

2.4 模型选择过程

2.4.1 算法初选

2.4.2 算法验证

2.4.3 算法优化

2.4.4 平衡数据集

2.4.5 修改模型参数

2.5总结

第三章常用可视化的多维分析

3.1 箱图

3.2雷达图

3.3 标签云

3.4 气泡图

3.5 树图

3.6 地图

3.7 高低图

3.8 双轴图

3.9 关系图

3.10 热图

第四章 SPSS Modeler建模组件介绍

4.1 数据预处理组件

4.1.1 数据清理组件

4.1.2 数据集成组件

4.1.3 数据选择组件

4.1.4 数据变换组件

4.2 数据挖掘建模组件

4.2.1 模型筛选

4.2.2 自动建模

4.2.3 决策树模型

4.2.4 贝叶斯网络模型

4.2.5 神经网络模型

4.2.6 支持向量机模型

4.2.7 时间序列模型

4.2.8 统计模型

4.2.9 聚类模型

4.2.10 关联分析

4.2.11 KNN模型

4.2.12 数据挖掘模式评估

4.3 知识表示

4.3.1 图形节点

4.3.2 数据输出

4.3.3 数据导出

第五章香水销售分析

5.1 香水销售数据预处理

5.2 香水销售数据预处理

5.3 影响详实销量的因素分析

5.4香水适用场所关联分析

5.5 香水聚类分析

5.6 香水营销建议

第六章 银行信用卡欺诈与拖欠行为分析

6.1 用户信用等级影响因素

6.1.1 客户信用卡申请数据预处理

6.1.2 信用卡申请成功影响因素

6.2 信用卡用户信用等级影响因素

6.3 基于消费的信用等级影响因素

6.4 信用卡欺诈判断模型

6.4.1 基于Apriori算法的欺诈模型

6.4.2 基于判别的欺诈模型

6.4.3 基于分类算法的欺诈模型

6.5 欺诈人口属性分析

6.5.1 欺诈人口属性统计分析

6.5.2 基于逻辑回归的欺诈人口属性分析

6.5.3 逾期还款的客户特征

6.5.4 基于决策树分析逾期客户特征

6.5.5 基于回归分析逾期客户特征

6.5.6 根据消费历史分析客户特征

6.5.7 基于聚类分析客户特征

6.5.8 基于客户细分的聚类分析

第七章海底捞火锅运营分析

7.1 火锅相关数据抓取

7.2 数据预处理

7.3 数据分析

7.3.1 海底捞运营分析

7.3.2店铺选址分析

7.3 菜品关联分析

7.4 用户评论与评分的关联分析

7.5 顾客情感分析

第八章商务宾馆竞争分析

8.1 目前经济型酒店行业竞争态势

8.2 用户相关数据准备

8.2 通过Python编程抓取评论

8.3 数据预处理

8.4 A商务宾馆客户数据分析

8.4.1酒店评分影响因素

8.4.2 酒店评分与酒店业绩关系

8.4.3 酒店评分分析

8.4.4 客户情感分析

8.4.5 竞争分析

8.5 一些建议

第九章 耐热导线工厂质量管理数据分析

9.1项目概述

9.2 耐热导线生产质量数据预处理

9.3 耐热铝线质量检测数据分析

第十章基于逻辑回归模型的高危人员分析

10.1 高危人员分析需求

10.2 高危人群相关数据收集与预处理

10.3建立模型

第十一章 卷积神经网络在音频质量评价领域的应用

11.1深度学习基础

11.1.1 深度学习发展过程

11.1.2 深度学习常用技术框架

11.1.3 常用的深度学习算法

11.2 卷积神经网络在音频质量评价中的应用

11.2.1 音频样本及特征预处理

11.2.2 音频特征选择

11.2.3 卷积神经网络模型训练

11.2.4 模型参数调优

11.3 性能验证

新书推荐① | 数据挖掘实用案例分析,内含赠书活动!

新书推荐① | 数据挖掘实用案例分析,内含赠书活动!

留言集赞送书

看到这里的小伙伴,幸好你没有错过!在底部留言邀请好友点赞,集赞数前两名者可获得本文书籍《数据挖掘实用案例分析》一本,快来获取礼品吧!

截止时间:即日起至3月10日

↓↓↓

以下为往期获奖书籍

新书推荐① | 数据挖掘实用案例分析,内含赠书活动!
新书推荐① | 数据挖掘实用案例分析,内含赠书活动!
新书推荐① | 数据挖掘实用案例分析,内含赠书活动!
新书推荐① | 数据挖掘实用案例分析,内含赠书活动!

幸运儿还是有的,万一就是你呢?

原文始发于微信公众号(PPV课数据科学社区):新书推荐① | 数据挖掘实用案例分析,内含赠书活动!

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/7157

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息