按时间归档:2017年05月
-
Python 自然语言处理入门
本文从概念和实际操作量方面,从零开始,介绍在Python中进行自然语言处理。 (作者案:本文是我最初发表在《ACM Crossroads》Volume 13,Issu…
-
三三制:大数据企业如何打造一支打不烂、打不散的团队?
拿破仑说:“进行战争的原则也和实施围攻的原则一样,火力必须集中在一个点上(一个地段上),而且必须打开一个缺口,一旦敌人的稳定被破坏,尔后的任务就是把它彻底击溃。 什么…
-
书单 | 程序员学数学读哪些书?(有赠书)
这个书单大家期待已久,之前我们分别单独推荐过《程序员的数学三部曲》《相爱相杀程序员的数学》,很受欢迎,近期又更新了几本经典的高等数学作品,同时也有优秀的科普作品出版。所以这次,做个…
-
阿里自然语言处理部总监分享:NLP技术的应用及思考
本文整理自阿里巴巴iDST自然语言处理部总监郎君博士的题为“NLP技术的应用及思考”的演讲。本文从NLP背景开始谈起,重点介绍了AliNLP平台,接着分享了NLP相关的应用实例,最…
-
跨界互联数聚未来-中国数据分析师行业峰会【北京】
峰会简介 中国数据分析师行业峰会由经管之家旗下「CDA数据分析师」人才教育品牌主办,从第一届起延续至今,已经成为广受瞩目的行业盛会。CDAS 2017将以「跨界互联,数聚未来」为主…
-
深度学习的“深度”有什么意义?
深度学习的”深度”, 早几年讨论的挺多的,身边有不同的理解:深度=更大规模的网络,也有认为:深度=更抽象的特征,近年来物理上也有人侧面显示:深度=玻璃相转变,如果后者的观点成立,那…
-
职场 | 使用 R 语言从拉勾网看数据挖掘岗位现状
因为毕业后想从事数据挖掘相关的职业,但对该行业的需求不太了解,网上资料太多查看花时间且抓不住重点,所以爬取了拉勾网上 900 多条相关的岗位共计 30 万字的职位描述的数据进行了相…
-
大赛 | Kaggle 数据挖掘比赛经验分享
简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013&nbs…
-
平台 | 零基础搭建Hadoop大数据处理-环境
由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介…
-
R 和 Python 中的文本挖掘:8 个入门小贴士
你希望学习文本挖掘,却发现大多数教程难度跨度很大?或者说你找不到心仪的数据集? 本文将会通过 8 个小贴士帮助你走进文本挖掘之门。 对文本保持好奇 在数据科学世界中,凡事的第一步都…