【陆勤笔记】《深入浅出统计学》2 集中趋势的度量:中庸之道 ppvke • 2015年6月30日 am12:00 • 数据挖掘 点击上方 “蓝色字” 可关注我们! 作者:王陆勤 有时候,把握问题的核心是当务之急。你的核心竞争力是什么?认识事物,要抓重点,抓事物的本质。这个方法论,也是一个很好的学习之道。 从一大堆数字中看出模式和趋势可能不容易,而求出平均数通常是把握全局的第一步。在认识数据的过程中,我们需要全局意识和整体观念,通过数据的平均数能够迅速找出数据中最具代表性的数字,从而得出重要的结论。统计世界中几个表示集中趋势的重要统计量:均值、中位数和众数。通过学习和理解,从而有效地汇总数据,尽可能得出简单而有用的结论。 均值 均值,平均数的一般量度。 计算大量平均数的一个常用方法,将所有数字累加起来,然后除以数字的个数。在统计学中,这种计算方法,称其为均值。 平均数具有多种,换而言之,不同的平均数有着不同的计算方法。 如果你想成为真正的统计高手,就需要把一些统计符号用顺手。也就是说,学会和使用一种合适的表示方式——符号表示法。 把所有的数字x累加起来,表示形式 均值的计算公式 均值的专用符号 如果用f代表频数,均值计算公式 中位数 当偏斜数据和异常值使得均值产生误导时,我们就需要使用其他方式表示典型值。我们可以取中间值,中间值是另外一种平均数,称其为中位数。 中位数计算方法 右偏和左偏 通过观察图形尾巴的走向以及中位数和均值的判别关系来确定是否存有偏斜。 右偏,均值被拉高,从而均值大于中位数;左偏,均值被拉低,从而均值小于中位数;对称,均值等于中位数。 众数 众数是第三种平均数,它是指一批数字中最常见的数字,即频数最大的数值,而且是最频繁出现的数值。 众数不仅能够用于数值型数据,还能应用类别数据。事实上,众数是唯一能够用于类别数据的平均数。 计算众数的方法 重要统计量 均值 异常值 偏斜数据 众数 总结:均值、中位数和众数 思考题: 1 常用的平均数有哪些?请举例说明。 2 众数怎么计算,请选择一种程序语言编程实现? 3 动动笔,做个计算。 王陆勤,深圳大学智能信息处理研究生,广东科技学院计算机系讲师,PPV课讲师团成员。热爱数据科学,专注机器学习,有着丰富的使用R语言做数据处理和分析的经验。PPV课在线课程:《R语言入门班》 【陆勤笔记】《深入浅出统计学》1信息图形化:第一印象 PPV课原创文章,转载请注明出处! 点击下方“阅读原文”查看更多 ↓↓↓ 原文始发于微信公众号(PPV课数据科学社区):【陆勤笔记】《深入浅出统计学》2 集中趋势的度量:中庸之道 原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/21487