Category: 数据挖掘

分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度

在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更好地了解分类中的错误。

《1天搞懂深度学习》一本适合新手的学习教程!

《1天搞懂深度学习》一本适合新手的学习教程!

那么关于深度学习的资料,网上有很多,不过大部分都不太适合初学者。最近小编发现一套关于深度学习手册《1天搞懂深度学习》,是李宏毅教授写的,300多页,非常容易入门。不夸张地说,是我看过关于深度学习最系统,最通俗易懂的资料。

【电子书】《面向程序员的数据挖掘指南》

这是一本用于学习基本数据挖掘知识的书籍。大部分关于数据挖掘的书籍都着重于讲解理论知识,难以理解,让人望而却步。不要误会,这些理论知识还是非常重要的。但如果你是一名程序员,想对数据挖掘做一些了解,一定会需要一本面向初学者的入门书籍。这就是撰写本书的初衷。

手把手教你写网络爬虫(1):网易云音乐歌单

大家好,《手把手教你写网络爬虫》连载开始了!在笔者的职业生涯中,几乎没有发现像网络爬虫这样的编程实践,可以同时吸引程序员和门外汉的注意。本文由浅入深的把爬虫技术和盘托出,为初学者提供一种轻松的入门方式。请跟随我们一起踏上爬虫学习的打怪升级之路吧!

十最受欢迎的机器学习和数据科学Python库

在数据科学方面,Python的语法与数学语法最为接近,因此是数学家或经济学家等专业人士最容易理解和学习的语言。本文将罗列机器学习和数据科学应用程序中最有用的十大Python工具。

干货:Excel图解卷积神经网络结构

在本文中,我将会讨论 CNN 背后的架构,其设计初衷在于解决图像识别和分类问题。同时我也会假设你对神经网络已经有了初步了解。

一文读懂遗传算法工作原理(附Python实现)

作者 Shubham Jain 现身说法,用通俗易懂的语言对遗传算法作了一个全面而扼要的概述,并列举了其在多个领域的实际应用,其中重点介绍了遗传算法的数据科学应用。机器之心对该文进行了编译,原文链接请见文末。

理解NLP中的卷积神经网络(CNN)

现在当我们听到神经网络(CNN)的时候,一般都会想到它在计算机视觉上的应用,尤其是CNN使图像分类取得了巨大突破,而且从Facebook的图像自动标注到自动驾驶汽车系统,CNN已经成为了核心。

通过 Q-learning 深入理解强化学习

本文将带你学习经典强化学习算法 Q-learning 的相关知识。在这篇文章中,你将学到:(1)Q-learning 的概念解释和算法详解;(2)通过 Numpy 实现 Q-learning。

被眼睛欺骗?这正是你比机器高明的地方!深度学习如何处理认知错觉

上下滑动手机屏幕,让这些方块与你的屏幕对齐,你会发现… 这些方块居然是水平排列的! 实际上,这类视觉错觉展示了人类感知世界的特殊方式,也是人类和目前深度学习认知的重要区别。 今天,我们就从这一不同出发,谈谈人类感知世界的机制,并由此畅想机器学习未来的发展方向。

结合 Apache Kafka 生态系统,谈谈2018年机器学习五大趋势

本博文的主要内容与我在 Confluent Blog 中写的关于 Apache Kafka 生态系统和机器学习文章一样,但这里我更关注深度学习/神经网络。我还讨论了 Apache Kafka 生态系统中的一些创新以及机器学习最近几个月的趋势:Uber 和 Netflix 上的 KSQL,ONNX,AutoML 和机器学习平台。

切换注册

登录

忘记密码 ?

切换登录

注册