1. 首页
  2. 数据分析

【V课堂】R语言十八讲(十四)—几大检验

【V课堂】R语言十八讲(十四)—几大检验
在统计分析中,我们会听到很多检验,有T检验,卡方检验,秩和检验,F检验,费舍尔检验等等,这么多检验,光听就要晕了,还怎么用啊?哪种检验什么时候能用什么时候不能用,能用的检验效果好不好,有什么优缺点,等够达到什么目的,你清楚吗?如果你不清楚,平时只是用,那么你对你做出的分析结果放心吗?这篇就是集中的讲解一下这几大检验的来龙去脉,原理和适用场景.
1. 什么叫检验?

【V课堂】R语言十八讲(十四)—几大检验

在统计学中检验这个词,说难也难,那么多检验,用公式推导还是相当复杂,说简单也简单,比方说:有一个人声称自己是射击高手,我们表示怀疑,或者说想证明,那好,你说你是高手,来我们检验一下,你打几枪,打几枪看看你中的环数,要是环数还都挺高,那我就相信了,如果很低,甚至落把了,我肯定是不信的,对吧?这就是检验.统计学中也是这个道理.
第一步:首先提出假设:记做H0假设,或原假设
第二步:抽个样本计算一下统计量,得到某个具体的值
第三步:看看这个值在不在置信区间,或者看看这个值发生的概率是多少,要是太小,那就拒绝原假设.(这里说法有点不严密,具体解释可以参看R语言十八讲之九)
2.不同的检验方法

【V课堂】R语言十八讲(十四)—几大检验

那么这么多检验方法,实际上就是源自于第二步的处理,第二步处理形式不同,那么这个检验方法也不同.
Z检验:就是指构造的统计量服从正态分布,那么算出来的具体的统计量值便可以通过正态分布表查出其概率也就是其P值.用 来决定是否拒绝原假设.
卡方检验(chisq.test): 就是指构造的统计量服从卡方分布,那么算出来的具体的统计量值便可以通过卡方分布表查出其概率也就是其P值.用来决定是否拒绝原假设.
其他的,T检验,F检验,都是同一个道理.那么为什么没有说秩和检验(wilcoxon)了?
首先,秩和检验还是相对前面几个比较特殊的, 首先,什么叫秩?秩有秩序这一个词,再看看秩在统计学中的意思,有n个样本观测值,将他们从小到大排列起来,例如 1,3,5,6,7,9,10,那么观测值3的秩就是2,观测值5的秩就是3.发现没,秩就是排序后,数据的序号.那么秩和检验就是将两个样本混合再排序,找出样本1中所有数据的秩再求和,找出样本2中所有数据再求秩再求秩和,我们可以想象,如果两样本是同一个妈生的(意指来自同一总体分布)那么,其中一个样本数据和另一个样本数据大小不至于相差太大,那么秩和也不应该全部或大部分来自序号较小和序号较大的那部分吧,也就是秩和会在一个范围面,这个范围就是置信区间,超出了就拒绝假设,说明两个样本不是来自同一分布。
3.常用统计量

【V课堂】R语言十八讲(十四)—几大检验

几大检验的情况都说明了,其实说到这里,应该你都明白了怎么用上面几大检验,如果你数学够好,碰到一个问题,你构造一个统计量,然后推导一下,这个统计量服从什么分布,就用什么统计量就OK 啦,但是,往往我们还没有那个水平,现阶段我们就记住几个常用的模型,然后应用的时候套用就可以了,这里我也帮大家整理了一下:
【V课堂】R语言十八讲(十四)—几大检验
PPV原创文章,示经允许严禁转载

原文始发于微信公众号(PPV课数据科学社区):【V课堂】R语言十八讲(十四)—几大检验

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/14251

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息