1. 首页
  2. 数据分析

【V课堂】R语言十八讲(八)—简单运算

点击上方免费订阅(学习)

这节我们将会讲解R语言基础的最后一节,数据的计算,包含了一些简单的统计数字特征和简单的四则运算,逻辑运算等等,也涉及到了矩阵方面的知识,由于数字特征,矩阵是高等数学的知识,所以这里会简单的介绍一下这些知识的数学背景,尽力的让各位知其然,也要知起所以然,如果我有讲解不清楚的,各位可以去翻翻相应的书籍,尽量弄懂这些知识,对于以后的数据分析有很大的帮助,因为许多模型都是需要这些基础知识的,几乎是到处要用.废话不多说,我首先来简单说明其数学含义,然后再用R来实现一次,这些函数语法都很简单,主要是理解数学含义.

1.四则运算

+ – * / 这个不用说了,加减乘除都会,然后就是 ^这个表示指数,我们前面学到的 : 也是一个运算符,表示生产序列,它的运算级别要高于加减乘除的,这个一定要注意,prod就是连乘,abs是绝对值,sqrt是开更号,log,exp,diff分别是什么了?来看看R里面的例子就一目了然了.

【V课堂】R语言十八讲(八)—简单运算

2.统计数字特征

均值 mean 就是我们说的平均值,在统计学中,均值能够表现一组数据的中心,或者说质心,就好像你端一个盘子,只需要 将盘子的重心点拖住,盘子就不会倒一样,由此物理常识我们拓展到均值的特性,就是所有点到均值的距离,我 们也可以理解为误差,其正负抵消后最后一定为0,误差的天平一定是平衡的 .是一个很重要的特征,当然当它 表示数据的水平时,有一个缺点,就是容易受极端值影响,一组数据若有一个极小或者极大的值,这时,均值就不 能很好的反映数据的水平.

中位数 median 就是将数据按从小到大的顺序排列起来,最中间的那个数,它3同均值一样反映了数据的水平,它的好处就是 不受极端值得影响,我们常常在箱线图中用到它

方差var 通俗的讲就是把数据的每一点与均值的距离的平方加起来再求均值,反映了整个数据离散的状况,这里用到平方 纯粹是避免正负抵消的,所以我们完全可以理解为,所有点与均值点的误差的平均情况.若把均值点当作是某一 正确值,那么其他的点就是对正确值的模拟,他们的距离就是误差,这就像我们射箭一样,靶心是均值点,其他的 点就是我们射的箭,这时用所有箭到中心的误差情况求平均,就可以一定说明你的射箭水平了.

标准差sd 就是方差开更号后的结果,其意义同方差.

极差range 就是最大值减最小值,即所谓的值域.

最大值max,最小值min这就不用讲了.

【V课堂】R语言十八讲(八)—简单运算

3.数字精度

ceiling 进一法 即取大于这个数的最小整数

floor 取整,取这个数整数部分

round 四舍五入

signif 有效数

【V课堂】R语言十八讲(八)—简单运算

4.矩阵计算

相乘:分为两种相乘 ,一种是点积,数量积,其乘法法则是将两个向量的对应的数相乘后求和.如a(1,2,3,4) 与b(1,2,3,4) 那么点积就是1*1+2*2+3*3+4*4=30,记住点积得到的结果是一个数.另外一种是乘积,它有一个法则,就是前面的矩阵(包括向量,向量就是矩阵的一种)的列数要与后面矩阵的行数相同,才能相乘.如A是3行4列的,B是4行5列的这样就能相乘,而且只能是AB乘不能是BA乘,也就是说外积不能交换顺序.AB乘得到的是另一个3行5列的矩阵,而a是1行4列,b是1行4列,是无法相乘的,只有将a转置为4行1列才能相乘.R中点击是%*%表示

转置: 就是把矩阵的第1行变为第1列,第2行变为第2列….用t表示

对角线:就是矩阵第1个数和最后一个数连线,这条线上是数就是矩阵对角线,对角线矩阵,指的是只有对角线上有非0数,其他 的数全为0.

求逆:我们不用掌握求逆的变换方式,比较复杂,设计伴随矩阵.我们只需记住,Aa=b这个等式,这个等式表示的是一个方程组 若已知矩阵A和向量b,那么a就等于A的逆乘b.

求特征值:这个一时半会真讲不清楚,各位还是翻翻书了解.

【V课堂】R语言十八讲(八)—简单运算【V课堂】R语言十八讲(八)—简单运算


未完待续,

PPV原创文章,未经许可严禁转载. (文:@白加黑治感冒)

【V课堂】R语言十八讲(八)—简单运算

PPV课-国内领先的大数据学习社区和职业培训平台

数据驱动未来,我们开启智慧,,欢迎关注!

原文始发于微信公众号(PPV课数据科学社区):【V课堂】R语言十八讲(八)—简单运算

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/14726

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息