按时间归档:2016年09月
-
常用推荐算法(50页干货)
内容主要围绕电商中用到的一些推荐算法,参考了Xavier Amatriain在CMU的Machine Learning暑期学校上的讲授的内容。 PS:建议阅读方式——点击图片,横屏…
-
《R语言数据挖掘与机器学习特训班》10月2-5日全面掌握R语言高级编程和数据挖掘方法!
大数据时代数据挖掘的必备技能 R语言数据挖掘与机器学习特训班 在最近一次数据挖掘领域语言流行度的调查中,R语言位居数据挖掘领域所有语言之首。2014 Dice Tech Salar…
-
非主流自然语言处理——遗忘算法系列(四):改进TF-IDF权重公式
一、前言 前文介绍了利用词库进行分词,本文介绍词库的另一个应用:词权重计算。 二、词权重公式 1、公式的定义 定义如下公式,用以计算词的权重: 2、公…
-
编译 | 机器学习的趋势和人工智能的未来
数据飞轮,算法经济,和智能云托管的融合意味着每家公司现在可以是一个数据公司,每家公司现在可以访问算法智能,并且每一个应用程序可以是一个智能应用。 每家公司现在是一个数据公司,在一定…
-
如何快速提高Excel逼格?我有办法!
来源:https://www.zhihu.com/question/20586917 此文不作商用,仅供学员学习交流用途。 ◆◆◆◆◆◆◆◆分割线◆◆◆◆◆◆◆◆ 更多excel好…
-
非主流自然语言处理——遗忘算法系列(三):分词
一、前言 前面介绍了词库的自动生成的方法,本文介绍如何利用前文所生成的词库进行分词。 二、分词的原理 分词的原理,可以参看吴军老师《数学之美》中的相关章节,这里摘取Goog…
-
如何看待京东平台数据化运营实践?
前不久召开的CDAS2016中国数据分析师行业峰会,电商大数据分论坛有幸请到京东商城研发POP平台生态服务组负责人李星毅,他分享了京东电商平台数据化运营的宝贵经验。下文即根据李星毅…
-
互联网数据分析师训练营(第一期) -大嘴巴漫谈数据挖掘
互联网数据分析师训练营(第一期) –大嘴巴漫谈数据挖掘 【课程背景】 移动互联时代,业务的复杂性也就决定了业务经营分析的复杂性及用户和业务交叉的复杂性,业务的发展必须满…
-
非主流自然语言处理——遗忘算法系列(二):大规模语料词库生成
一、前言 本文介绍利用牛顿冷却模拟遗忘降噪,从大规模文本中无监督生成词库的方法。 二、词库生成 算法分析,先来考虑以下几个问题 问:目标是从文本中抽取词语,是否…
-
【干货长文】神经网络浅讲:从神经元到深度学习
神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。 …