Category: 大数据

分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度

在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更好地了解分类中的错误。

《1天搞懂深度学习》一本适合新手的学习教程!

《1天搞懂深度学习》一本适合新手的学习教程!

那么关于深度学习的资料,网上有很多,不过大部分都不太适合初学者。最近小编发现一套关于深度学习手册《1天搞懂深度学习》,是李宏毅教授写的,300多页,非常容易入门。不夸张地说,是我看过关于深度学习最系统,最通俗易懂的资料。

图灵数据科学新书上市

6本新书上市:

《Spark机器学习(第2版)》
《生命是什么》
《统计学核心方法及其应用》
《说服式设计七原则:用设计影响用户的选择》
《设计与沟通:好设计师这样让想法落地》
《千亿个宇宙:多世界的黑暗秘密》

【电子书】《面向程序员的数据挖掘指南》

这是一本用于学习基本数据挖掘知识的书籍。大部分关于数据挖掘的书籍都着重于讲解理论知识,难以理解,让人望而却步。不要误会,这些理论知识还是非常重要的。但如果你是一名程序员,想对数据挖掘做一些了解,一定会需要一本面向初学者的入门书籍。这就是撰写本书的初衷。

Cloudera Hadoop认证培训课程 | 4季度培训计划

Cloudera教育培训是全球领先的Apache Hadoop培训和认证厂商。我们所开发的全面解决方案可以针对Hadoop管理员、开发人员、数据分析师、数据科学家及任何大数据专业人士(利用企业数据中心(EDH)建立聚合应用)提供特定角色的培训。我们的培训内容深度覆盖整个生态系统的项目包括Spark、Solr、HBase、Pig、Hive、Impala、Hue、Sqoop及Oozie等工具。Cloudera培训教材源自各行业客户现实经验中的最佳实践,行业覆盖了金融服务业、医疗保健业、数字媒体业、零售业、制造业和电信业。

手把手教你写网络爬虫(1):网易云音乐歌单

大家好,《手把手教你写网络爬虫》连载开始了!在笔者的职业生涯中,几乎没有发现像网络爬虫这样的编程实践,可以同时吸引程序员和门外汉的注意。本文由浅入深的把爬虫技术和盘托出,为初学者提供一种轻松的入门方式。请跟随我们一起踏上爬虫学习的打怪升级之路吧!

十八大与十九大报告全文分词绘制词云图

在网上找到十八大报告全文与十九大报告全文,链接如下所示:
1、胡锦涛在中国共产党第十八次全国代表大会上的报告(http://cpc.people.com.cn/n/2012/1118/c64094-19612151-1.html)
2、习近平作十九大报告全文实录(http://news.163.com/17/1018/15/D11S5V3Q0001899O.html)

AI时代就业指南:作为一名大一新生学习的专业是大数据专业, 那么应该从哪里开始入门学习, 还有可以学习的书有哪些呢?

在大学本科阶段,没有什么比学好数学更为重要的了:先关课程包括《高等数学》《线性代数》《概率与数理统计》《数值分析》《多元分析》《泛函分析》。数学是一门基础学科,需要长时间的学习和知识积累,而且数学课程离开学校是没地方补

十最受欢迎的机器学习和数据科学Python库

在数据科学方面,Python的语法与数学语法最为接近,因此是数学家或经济学家等专业人士最容易理解和学习的语言。本文将罗列机器学习和数据科学应用程序中最有用的十大Python工具。

干货:Excel图解卷积神经网络结构

在本文中,我将会讨论 CNN 背后的架构,其设计初衷在于解决图像识别和分类问题。同时我也会假设你对神经网络已经有了初步了解。

一文读懂遗传算法工作原理(附Python实现)

作者 Shubham Jain 现身说法,用通俗易懂的语言对遗传算法作了一个全面而扼要的概述,并列举了其在多个领域的实际应用,其中重点介绍了遗传算法的数据科学应用。机器之心对该文进行了编译,原文链接请见文末。

理解NLP中的卷积神经网络(CNN)

现在当我们听到神经网络(CNN)的时候,一般都会想到它在计算机视觉上的应用,尤其是CNN使图像分类取得了巨大突破,而且从Facebook的图像自动标注到自动驾驶汽车系统,CNN已经成为了核心。

切换注册

登录

忘记密码 ?

切换登录

注册