按时间归档:2017年09月
-
近7年上海天气数据抓取和分析(含代码)–爬虫部分
之前的一系列文章都讲了关于python的基础知识,接下来的一些内容会讲一讲可视化方面的内容。对于可视化而言,Python和R语言,我还是非常喜欢使用R语言的,因为用她作图既简介又高…
-
百度实习面试总结——百度大搜,机器学习实习生
简历是内推的,找到了川大的一位学姐,然后内推了简历。 过了几天,HR的电话打过来协商面试时间。一开始说的是下午两点,我想了想,好像有一节选修课,于是想调整再晚一点,于是调到了四点,…
-
KNN算法在保险业精准营销中的应用
一、KNN算法概述 KNN是Machine Learning领域一个简单又实用的算法,与之前讨论过的算法主要存在两点不同: 它是一种非参方法。即不必像线性回归、逻辑回归等算法一样有…
-
文本挖掘小探索:避孕药内容主题分析
作者:冯大福 舆情监测一直是众多品牌关注的地方,尤其品牌想知道在品牌推广,品牌策略,品牌广告中出现的问题,从而能进行策略上的改进,但是现在很多人都是读帖子,笔者在4年前做舆情分析时…
-
数据挖掘常用模型构建示例(R语言版)
Linear Regression library(MASS) lm_fit = lm(medv~poly(rm,2)+crim,data = Boston) # 构建线性模型 s…
-
PyTorch和TensorFlow哪家强:九项对比读懂各自长项短板
近日,斯坦福大学计算机科学系博士生 Awni Hannun 也发表了一篇文章,谈了自己对 PyTorch 和 TensorFlow 这两大明星框架的心得体验,并在不同的方面对这两者…
-
干货–C5.0与CART算法实战
在上一期的《浅谈C5.0与CART算法的比较–理论理解》我们详细讲解了有关C5.0决策树和CART决策树的理论知识,包括构造树过程中如何选择节点变量、节点变量的分割点、…
-
【干货】– 带你抓取并分析知乎高评分电影
最近突然想看电影了,跑去电影天堂却不知道该看哪一步,很纠结呀,想来想去还是去知乎上搜搜高评分的电影。发现新大陆呀,还是网友的力量大,挖掘出了高评分的电影,并作一一罗列,足足400多…
-
[译]大数据分析平台搭建教程:基于Apache Zeppelin Notebook和R的交互式数据科学
介绍 这篇文章的目的是帮助您开始使用 Apache Zeppelin Notebook,它可以满足您用R做数据科学的需求。Zeppelin 是一个提供交互数据分析且基于Web的笔记…
-
入行AI最需要的五大技能
摘要:作为一名软件工程师,我们应该活到老学到老,时刻与不断发展的框架、标准和范式保持同步。同时,还要能活学活用,在工作中使用最合适的工具,以提高工作效率。随着机器学习在越来越多的应…