假设检验概述

如题所述

第1个回答 2022-06-27

讲到统计学，终究会谈到假设检验的问题，做过数据分析的人也都是耳熟能详，但如果让你具体讲讲假设检验的原理，什么是P值，为什么用t检验，为什么用F检验，估计能问倒一操场。

作为本公众号的开篇处女作，从假设检验入手，讲一下假设检验的基本原理与过程。

首先明确下假设检验在统计学里的位置：统计推断是统计学的重要分支，做统计推断有两个重要方法，即参数估计与假设检验。参数估计是用样本统计量估计总体参数，而假设检验，则顾名思义，先假设，后检验，例如假设均值为μ，然后根据样本信息检验均值是不是μ，实际上是要证明均值不是μ，即推翻原假设。逻辑上采用的是反证法，根据统计上的小概率原理。

举例来说，魔都官方数据说居民人均工资1w，对于我这种北漂来说就打了个大问号，然后就局部范围内做了个统计（假如样本有代表性），统计均值为7k, 那我这个结果有没有信服力，那我们可以检验一下，设置95%的置信水平，算出P值为0.0002，那我可以很自信的说官方数据在开火车，不值得信。因为P值为0.0002意味着，如果居民人均工资为1w，那么我统计出均值为7k的概率为0.0002，这么小的概率竟然这么容易就让我碰上了，显然真实的人均工资不可能为1w啊，这就是根据小概率原理来推翻原假设。

接下来我们讲一下假设检验的套路,讲述过程中你也许会有疑问，为什么这样，不要担心，先往下看，我会陆续对假设检验的细节作出补充，如果未涉及到可以在评论中提出，我会补充上）：

套路1，提出假设，也就是我猜结果会是什么。猜完之后进入套路2，即我要拿什么去验证假设，这里我们叫做检验统计量。检验没有绝对的对错，所以我们要设定一个显著性水平，就是套路3，相当于设定一个门槛，在门外面就拒绝进门，统计学上叫拒绝域，拒绝的是原假设。套路第四步就是将门在哪儿计算出来，依据的是前两步确定的检验统计量以及显著性水平。最后就可以做出决策啦，看一下到底在门里面还是门外面。

接下来将提到的套路跟大家套路一下：

假设的提出包括原假设与备择假设 。原假设（H0）则是我们收集证据想要推翻的假设, 而备择假设（H1）则是要去支持的，所以大家可以根据实际情况来设定原假设与备择假设。原假设与备择假设互斥。假设检验是围绕着对原假设是否成立展开的。假设检验还会涉及到两类错误的问题，这个内容较多，会单独讲解。

检验统计量是用于假设检验决策的统计量。 如何去选择统计量呢？这与参数估计相同，需要考虑样本总体个数，样本大小，通常大于30个样品我们认为是大样本，以及总体方差是否已知，如果未知，可以用样品方差近似计算。是不是感觉有些头晕，撑住，这是做假设检验的关键，告诉你什么情况下采用什么样的检验方法，记住这儿，以后就不会没心没肺的只会t检验啦。贴心的我给大家整理了检验统计量的选择图谱，对家直接对号入座就可以啦，记住这些，再遇到假设检验的问题，你会感觉厉（niu）害(bi)的不要不要的。

配对样本的检验： 两个总体参数的假设检验过程中，我们假定样本是独立的，但有种情况下样本间可能存在相依的关系，这种情况下两个正态总体的问题可以按照一个样品总体进行分析。举个例子：我想测试某个洗涤产品的洗涤效果，我可以测一下衣服洗之前的洁净程度，用产品洗之后的洁净程度，这样就得到了两个总体，可以按照方差未知的小样本t检验进行分析。但是，同是一件衣服，洗之前和洗之后数据之间是有对应关系的，我可以将洗前洗后的洁净程度做差值，检验差值是否为0，这样就转化为一个总体样本的t检验。

具体的统计量的计算公式此处未给出，主要考虑到现在都用统计软件进行计算，关键要明确自己的统计问题，选择恰当的检验统计量，然后在统计软件上就可以开挂了！

显著性α： 这是犯一类错误的概率，即原假设为真时，拒绝原假设的概率。比如警察抓小偷时，明明是小偷，却判断失误当好人给放了的概率。也被称为抽样分布的拒绝域，这个可以由研究者事先确定。

计算检验统计量的值。 当确定了检验统计量以及显著性α的值，通常为0.01, 0.05，0.001，就可以通过统计软件或查表得到统计量的临界值 z _a 或 z _a/2 ， t _a 或 t _a/2

作出统计决策。 统计决策的确定有两种方式，一种是将检验统计量的绝对值与α水平的临界值进行比较，高于临界值则拒绝原假设，低于临界值则不能拒绝。另外一种方式是采用P值进行决策。个人比较倾向第二种，当然现在的统计学软件会将这些值一并给出。我们通常将P值称为观测到的显著性水平，即当原假设为真时得到样本观察结果或者更极端结果的概率，如果P值很小，说明得到观测结果的概率很小，如果出现了，根据小概率原理，我就有理由拒绝原假设了。如果事先确定了显著性水平，比如α= 0.05，在双侧检验中可以比较P值与0.025的大小决定是否拒绝原假设，单侧检验中可以比较P值与0.05的大小进行决策。当然也可以直接使用P值，按照我们所需要的显著性水平进行决策。

以上就是假设检验的基本原理及流程。懂了这些就几乎可以秒杀一切你所遇到的假设检验问题。还有同学经常问为何把小概率标准定为0.05，哈哈，不要问我，因为我不知道。著名英国统计学家Fisher就这样用的，无解。

最后给大家举个例子，一起感受一下🐂逼的人生：

“多吃谷物，将有助于减肥。”为了验证这个假设，随机抽取了35人，询问他们早餐和午餐的通常食谱，根据他们的食谱，将其分为二类，一类为经常的谷类食用者(总体1)，一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验，得到如下结果：检验该假设(a = 0.05)

1. 原假设：u1-u2>=0

3. 在0.05显著性水平上拒绝原假设。

4. 结论，没有证据证明多次谷物有助于减肥。

相似回答

统计推断的内容包括答：假设检验(hypothesistesting)，又称统计假设检验，是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。统计推断概述：统计推断是在概率论的基础上依据样本的有关数据和信息，对未知总体的质量特性参数，做出合理的判断和估计。统计在研究现象的总体数量关系时，需要了解的总...

什么是方差分析答：方差分析(Analysis of Variance，简称ANOVA)，又称“变异数分析”，是一种假设检验方法，即基本思想可概述为：把全部数据的总方差分解成几部分，每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应，将各部分方差与随机误差的方差相比较,依据F分布作出统计推断，从而确定各因素或交互作用的效...

统计推断概述答：其中描述性统计一般用来做探索性数据分析，所谓的推论统计，就是今天我们主要讲的统计推断，其意思就是用统计学的方法来推断。统计推断（区别于贝叶斯推断，这里主要基于频率推断）主要可以分为两大类：一类是参数估计问题；另一类是假设检验问题。其中假设检验又可分为参数检验与非参数检验。至于怎么推断...

参加六西格玛绿带培训时,六西格玛绿带课的课程有哪些?答：（5）六西格玛设计（DFSS）经典课程培训（热门）（6）Minitab软件实用课程培训（应用统计学）（7）测量系统分析（MSA）课程培训（8）统计制程控制（SPC）课程培训（9）潜在失效模式与效应分析（FMEA）课程培训（10）试验设计（DOE）经典课程培训（热门）（11）试验设计（DOE）实用课程培训（热门）（12...

统计学概论的图书目录答：抽样推断的特点二、总体参数和样本统计量三、抽样推断的基本条件四、抽样推断的误差第二节总体参数估计一、总体参数估计概述二、点估计三、区间估计四、样本容量的确定第三节 假设检验概述一、假设检验的基本概念二、假设检验中的基本问题三、总体平均数的检验四、总体成数的检验五、P值检验思考与练习第...

描述统计跟推论统计怎么区分? (统计学)答：2、推论统计的概述：推论统计是借助抽样调查，从局部推断总体，以对不肯定的事物做出决策的一种统计。二、两者的内容不同：1、描述统计的内容：描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。2、推论统计的内容：包括总体参数估计与假设检验两种。前者以一次性抽样实验为依据，对整个总体的某...

统计学常考的名词解释和简答有哪些答：22、参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。 23、非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 24、秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并...

关于概率论,高数一和统计学的问题答：第六章 假设检验 第七章方差分析第八章相关与回归分析第九章时间序列分析第十章统计指数第十一章统计决策第十二章产品质量的统计管理第十三章国民经济统计概述附录一 Excel在统计中的应用袁卫、庞皓、曾五一主编，高等教育出版社，2002年。2.统计学——基本概念和方法第1章统计学...

统计学导论的4图书信息答：主要内容包括：统计学的基本框架、统计资料的整理、收集与显示、数据分布特征的描述、概率基础、参数估计、假设检验与方差分析、相关分析与回归分析、非参数统计、时间序列分析、对比分析与指数分析、统计决策、统计综合评价、Excel在统计中的应用等。通过本书的学习，可以使学生具备基本的统计思想，掌握基本的...

大家正在搜

独立性检验h0答题模板假设检验的5个步骤例题假设检验适用的条件假设检验的实际例子假设检验简单例题假设检验的例题及答案假设检验在生活中的应用实例假设检验的一般四个步骤零假设正确解题步骤高中