1. 首页
  2. 数据分析

【收藏】50个数据科学和机器学习速查表

在数据科学领域有成千上万的包和数以百计的函数公式,你虽然不需要掌握所有的这些知识,但是有一些速查表在你的学习中是非常重要的。学习大数据包括对统计学、数学、编程知识(尤其是R、python、SQL)等知识的理解,还需要理解业务来驱动决策。这些表单也许能给你一些帮助。

Python的速查表

Python在初学者中非常受欢迎,同样足以支持那些最受欢迎的产品和应用程序,它的设计让你在编程的时候感觉同用英语写作一样自然,Python basics 或者Python Debugger的速查表覆盖了重要的语法。

Python 2.7 Quick Reference Sheet

Python Cheat Sheet by DaveChild

Python Basics Reference sheet

Python Debugger Cheatsheet

NumPy / SciPy / Pandas Cheat Sheet

Python OverAPI cheatsheet

Python Decorators cheatsheet

Python 2.4 Quick Reference Card

Python 3 Cheat Sheet

Python Language & Syntax Cheat Sheet

R的速查表

R的生态系统一直在扩大,大量的引用是必需的。R的速查表覆盖了大部分的R知识,Rstudio也发表了一些速查表让R学起来更简单。当你要展示结果的时候,用ggplot2来进行数据可视化可能是不错的选择。

R cheat sheet (Google Drive)

R functions for Regression Analysis

R Reference Card

R functions for Time series Analysis

R Reference Card for Data Mining

R Cheat Sheet

Data Analysis the data.table way

Interactive Web Apps cheatsheet by R studio

Data Visualisation with ggplot2 cheatsheet by R studio

Package Development with devtools cheatsheet by R studio

Data Wrangling cheatsheet

R markdown cheatsheet

R Markdown Reference guide

R Data Management cheatsheet

R Cheatsheet for graphical parameters

MySQL & SQL速查表

对一个数据分析师来说,SQL基础是非常重要的。PIG和 Hive Query语言和SQL一样都是普通的结构化语言。SQL的速查表提供了5分钟的快速阅读,之后你就可以进入Hive & MySQL!

MySQL Cheatsheet by Dave child

SQL Cheat sheet

SQL in one page

MySQL Reference guide

Visual SQL Joins

SQL for dummies

Spark速查表

Apache Spark是一个用于大规模数据处理的引擎,对于某些应用程序,比如机器学习,Spark会比Hadoop MapReduce快100倍。Apache Spark的速查表解释了大数据的生态系统,并说明常用的行为和操作。

https://dzone.com/refcardz/apache-spark

Scala cheatsheets 1

Scala cheatsheets 2

Scala from DZone Reference Card

Spark cheatsheet on github

Scala on Spark Cheatsheet

Essential Apache Spark cheatsheet by MapR

Hadoop & Hive的速查表

Hadoop是一种传统的工具,提供开源软件框架开源并行处理大量的数据。

Hadoop for Dummies cheatsheet

Getting Started Apache Hadoop Reference Card

Hadoop Command Line cheatsheet

Working with HDFS from the command line – Hadoop Cheat sheet

Hive Function cheatsheet

SQL to Hive cheatsheet

Machine learning速查表

我们经常会花很多时间思考用哪种算法,这些速查表给出了关于你的数据和你需要解决的问题,然后提出你可以尝试的算法。

Choosing the right estimator(估计量) Machine Learning cheatsheet

Patterns for Predictive learning cheatsheet

Machine learning algorithm cheat sheet for Microsoft Azure

Machine Learning cheatsheet Github 1

Machine Learning cheatsheet Github 2

Machine Learning which algorithm performs best?

Cheat sheet 10 machine learning algorithms R commands

Patterns for Predictive Analytics

Django速查表

Django是一个免费和开源的web应用程序框架,用Python编写的。如果你刚入门Django,通过这些速查表你快速了解到概念,进入更深层次。

Django cheat sheet v.1

Django cheatsheet 1

Django cheatsheet 2

Django cheatsheet 3

Django cheatsheet 4

Django Reference Cheatsheet

Django Quick start guide & Cheatsheet

Flask Cheatsheet

来源:数据客

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复每日一课查看【每日一课】手机在线视频集锦

PPV课大数据ID:ppvke123(长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

原文始发于微信公众号(PPV课数据科学社区):【收藏】50个数据科学和机器学习速查表

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/20870

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息