1. 首页
  2. 数据分析

回顾R和微软过去的一年

回顾R和微软过去的一年

 

托马斯·斯莫尔的ML / DL博客最近回顾了数据科学,机器学习和深度学习显著的进步-其中许多涉及R和/或微软。以下是他们的亮点:


R Project

R和Python保持其作为开放数据科学主要工具的领导地位。Python与R的争论仍在继续,一个新的共识是数据科学家应该考虑学习两者。R有一个更强大的统计和机器学习技术库,在使用小数据时更加灵活。Python更适合开发应用程序,而Python开源许可证对商业应用程序开发的限制较少。

  • R用户社区在2016年继续扩大。在2016年O’Reilly数据科学薪资调查中,它排名第二,仅次于SQL;首先在  KDNuggets 投票; 并首先在  Rexer 调查。R在IEEE Spectrum排名中排名第五。

  • R的功能快速增长。今年四月,微软Andrie de Vries报道, CRAN(R里主要贡献包的库)里有超过8000个包。截至12月中旬,有9737个包。CRAN的机器学习包在数量和功能上继续增长。

  • R联盟,Linux基金会的一个合作项目,在2016年取得了一些进展。IBM和ESRI加入该联盟,其成员目前也包括 Alteryx,Avant,DataCamp,Google,Ketchum Trading,Mango Solutions,微软,甲骨文,RStudio,和TIBCO。现在有三个工作组和八个资助项目。

  • Hadley Wickham有一个好年景。作为R项目的最大贡献者之一,Wickham共同撰写了数据科学相关的R,并于9月发布了tidyverse 1.0.0。在优秀工具的宣言中,Wickham解释了一个好的API的四个基本原则。

  •  Max Kuhn,应用预测建模的作者和插入符包学习机的开发,11月加入RStudio。RStudio此前聘请了Joseph Rickert,且他就此离开了微软。

  • AT&T实验室正在与R做一些令人印象深刻的工作,包括使用Hadoop和其他数据平台进行外部处理的分布式后端的开发。在UseR!发布会上Simon Urbanek 提出了一个总结。

  • 枚举今年在R中进行的所有有趣的分析是不可能的。David Robinson’s对Donald Trump’s的推文的分析让人产生了共鸣; 使用tidyverse,tidytext和TWITTER,Robinson能够在同一帐户中区分候选人的“声音”和他的员工的“声音”。

  • 在Revolutions博客,微软的David Smith调查了女性在R社区的增长规律。


微软

微软在机器学习和深度学习方面有一年了。正如我在第一部分和第二部分所指出的,2016年MSFT在Azure中推出了用于视觉,报告,语言,知识和搜索的认知API; AzureHDInsight中的Spark的管理服务;增强了Azure机器学习和2.0版本的深度学习框架,更名为MicrosoftCognitive Toolkit。

这只是为初学者提供的。

  • 在一月份,微软宣布推出微软R服务器,并在2015年收购了革命分析产品。微软R服务器包括一个增强R分布,可扩展的后端,和集成工具。在这一年里,微软为R     Server发布了两个主要版本。在第8版中,公司加入了Spark的下推式集成。第9版更新了Spark     2.0的Spark集成,并添加了MicrosoftML,一个用于机器学习的新R包。

  • 微软在3月份发布了SQL     Server 2016嵌入式SQL     Server服务。在“Revolution”博客上,David     Smith报告了此发布。 TomažKaštrun解释了在SQL     Server你可以用R做什么。

  • 十一月,在扩展预览之后,Microsoft宣布了Azure     HDInsight的R     Server的普遍可用性,这是一个与从HDInsight创建的Spark集群集成的R的横向扩展实现。

  • 此外,在Azure中,微软添加一个Linux版本的数据科学虚拟机(DSVM)。以前可用作Windows实例,DSVM包括Revolution     R Open,Anaconda,Visual     Studio社区版,PowerBI桌面,SQL     Server Express和在Azure SDK。

  • PowerBI是微软强大的可视化工具,在8月增加了R支持。在计算机世界里,R用户Sharon     Machlis先生热情地说。更多详细内容在Revolution博客。

  • Visual     Studio的R     Tools于3月推出公开预览,9月份推出。另外在9月,微软发布了Microsoft     R Client,这是一个免费的数据科学工具,与Microsoft R Open和ScaleR分布式后端一起使用。

  • 微软数据科学家Gopi     Krishna Kumar,Hang Zhang和Jacob Spoelstra开发了一种数据科学方法,他们在9月的微软机器学习和数据科学峰会上提出了这种方法。David     Smith对此进行了报导。该方法(作者称为团队数据科学过程)包括一个标准目录结构,用于使用诸如Git之类的系统管理项目工件。它还包括支持该过程的开源实用程序。

  • 微软团队开发了一个识别对话语音的系统,就像人类的行为一样。该团队使用用Microsoft认知工具包(CNTK)构建的卷积和长期短期记忆(LSTM)神经网络。

  • 作为CNTK发布于2015年,Microsoft将其深度学习框架重新命名为Microsoft     Cognitive Toolkit(MCT)并发布了2.0版本,并提供了新的Python     API和许多其他增强功能。在VentureBeat,Jordan     Novet报道。

  • 该公司还在Azure中推出了22种认知API,用于视觉,报告,语言,知识和搜索。另外,MSFT在Azure     HDInsight发布了针对Spark的托管服务,并继续增强Azure机器学习。

  • MSFT十二月宣布Azure     N系列计算实例由普遍可用的NVIDIA图形处理器供电。


PPV课小组翻译,未经许可严禁转载。

原文:https://www.r-bloggers.com/a-look-back-at-the-year-in-r-and-microsoft/

推荐课程

回顾R和微软过去的一年

 现场讲解 / 远程直播+上机操作+案例展示

报名上课享录制视频观看期限12个月

点击“阅读原文”了解


原文始发于微信公众号(PPV课数据科学社区):回顾R和微软过去的一年

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/4395

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息