用正态分布模型分析小概率事件(读书笔记)

如题所述

第1个回答  2022-07-14
在调查研究中,我们必须注意这一事实:样本数量的多少,和抽样结果中极端情况的出现概率相关。

因为大的总体计算出的标准差,要比小的总体计算出的的标准差低得多。同样一件极端事件,在大数量样本中需要跨越更多的西格玛,所以概率更低。

由此可以推断,在小的群体中应该会观察到更多的好事和更多的坏事。

我们经常被这样的类似情况迷惑,比如 长寿村 。

我们不完全否认外在因素对寿命的影响,例如空气质量,植被水源,生活习惯等。但我们同样需要考虑到, “村庄”这个小数量级的样本,本来就容易出现更好或更坏的极端情况。

我们甚至可以推断,和长寿村对应,一定有一个村庄是“短命村”。

我们首先应该看到,这种现象是一个概率问题,才能更理性客观的去分析其他因素对长寿的影响。才能避免“长寿村的月亮都比我们的圆”,这样的重大误解。

我有这种问题:很容易被标题党使用的吸引眼球的数据吸引,忍不住点开。但往往带着猎奇心理看到的事情,不过是一件小样本中的小概率事件。

知道了“均值标准差”的概念,能让我更理性的看待极端数据和现象。

它们出现的概率和样本数量相关,所以即便是真实的数据,也会传递给我们错误的“信息”。

其实严格来说信息不存在对错,是我们的理解,把信息扭曲了。
相似回答