参数估计

如题所述

参数估计,是根据样本的数据,按照一定公式计算出某个数字特征(平均数、方差等),来估计总体的某些数字特征。参数估计分点估计(或称定值估计)与区间估计两种。

在此之前,样本可理解为从一批样品中,通过观测或化验得到的一批固定数据,如γ照射量率、径迹密度、微量元素的含量等。但是,由于上述变量的随机性,加上抽样的随机性,因而容量为n的样本,实质上是一个n维随机变量。于是样本的特征数,如平均数

、方差s2等也随着所取样本不同而改变。因此,

、s等也是随机变量,也可以计算它们的平均值与方差了。

(一)样本特征数与总体特征数之间的关系

如果总体的均值为μ、方差为σ2样本容量为n,样本平均值�x的均值为

,方差为

,样本方差s2的均值为

,则样本特征数

、s2的特征数与总体特征数之间有如下关系:

1)样本平均数�x的均值等于总体的均值,即

放射性勘探技术

2)样本平均数的方差等于总体方差除于样本容量n,即

放射性勘探技术

3)样本方差的均值等于总体的方差,即

放射性勘探技术

但这时s2的计算公式要用

。其原因是此式是s2的无偏估计量。

上述式(8-17)~式(8-19)是用“样本”推断“总体”的理论根据。

(二)样本平均数

和方差s2的分布与总体分布间的关系

1)总体服从正态分布N(μ,σ2),则不论样本容量大小(即不论n为多大),样本平均数

总是服从正态分布N(μ,σ2/n)的。

2)若总体不服从正态分布,但样本容量很大(n>30~50)时,则样本平均数

也近似服从正态分布N(μ,σ2/n)。

3)若总体服从正态分布,只要样本容量n>20,则样本标准差S的分布近似正态分布N[μ,σ2/(2n)]。

上述这些关系是很重要的,是统计推断的重要理论根据。

(三)点估计

点估计是对总体参数做一定数值的估计。就是选择一个统计量(即根据样本数值,经过某种运算得到的特征数,如均值、均方差、偏度、峰度等),假如

为根据样本数据计算出的统计量,然后用它来估计总体的某个参数θ,那么这个统计量

就叫作总体参数θ的估计量。例如平均数

,就是总体均值μ的一个估计量;样本方差s2就是总体方差σ2的一个估计量,故

、s2就是统计量。显然总体参数θ的估计量有多种可供选择,在选择估计量

时,有一条最常用的标准就是无偏性。所谓无偏性就是要求θ的估计量

的均值正好等于θ,符合这一要求者,称为无偏估计量。

由式(8-17)和式(8-18)可知,无论总体服从何种分布,也无论样本容量n为多少,总有样本平均数�x是总体均值μ的无偏估计量。样本方差s2是总体方差σ2的无偏估计量。因此实际工作中往往用一批γ照射量率观测数据的众数(或平均数)来估计某岩体(测区)的γ照射量率底数,以一批铀矿石样品的平均品位来估计某矿带或矿床的铀平均品位;用样本的方差s2来估计总体方差σ2

(四)区间估计与信度

点估计(定值估计)难免有偏差,而且偏差的程度也不好估计。因此往往用区间估计来估计总体参数。区间估计不仅能对总体参数做出估计,且能指出总体参数落在此区间内的概率大小(概率用P来表示)。若以A表示某随机事件,则其概率记为P{A}。显然,概率小于等于1(必然事件),大于等于0(不可能事件),即0≤P≤1。

由前已知,当样本容量大(即n>30~50)时,不论总体服从何种分布(总体均值为μ,方差为σ2),总有样本平均数�x服从正态分布。根据本项目学习任务二的几个常用概率值可知

放射性勘探技术

根据以上分析可知,任何一个用来估计的区间,都联系于一定的概率值。这种概率反映了用该区间做估计的可信程度,故称置信概率,也称保证概率。然而,实际工作中,往往是先定出置信概率的大小,然后推算出一个具有这个置信概率的估计区间。通常人们在给出置信概率大小时,又不是直接给出置信概率,而是给出1与置信概率的大小的差,并用α来表示(即α=1-置信概率),α称为信度(或信任系数、置信水平、显著性水平),α介于0~1之间,表示犯错误的概率。由于置信概率=1-α,如α=5%,则置信概率=1-0.05=0.95。于是总体参数μ的估计区间定为

。在给定信度α的条件下,推算出的估计区间,叫作信度为α的置信区间,其上、下限称为置信上、下限,统称为置信限。

估计区间可用来确定抽样误差、预测矿石品位等方面。确定抽样误差(用样本的特征数,如平均数与方差来估计总体的特征数如均值与方差时所产生的偏差),就是在一定信度α下确定该误差范围,即置信区间。抽样误差用m来表示。例如用样本平均数μ来估计总体均值μ时的抽样误差范围,就是在一定信度下用区间(X-m,X+m)来估计总体均值μ,即

放射性勘探技术

式中:m——抽样误差;

t——概率系数;

——样本平均数的标准差;

σ——总体标准差;

n——样本容量。

因此,确定抽样误差,也就是在一定信度下,用区间

来估计总体均值μ。实际上只要求出满足P

=1-α的t值即可。而t值可从标准正态分布表F(u)反查u值表中查得(见附录一),即F(u)=1-α/2所对应的u值即为所求的t值。如α=0.05,F(u)=1-α/2=0.975,查附录一,得u=1.96,故t=1.96。

下面用一个例子来说明区间估计的应用。

[例8-3]用FD-3013B型仪器在某燕山早期第三阶段花岗岩体(

)测得154个γ照射量率数据;该样本的平均数与标准差已求出,分别为

=42.34γ,s=13.7γ。如果在信度α=0.05的条件下,用样本的平均放射性γ照射量率估计该岩体的放射性γ照射量率时,抽样误差为多少?该岩体放射性γ照射量率为多少?

解:由于信度α=0.05,故置信概率=1-α=0.95。所求的抽样误差m应满足下式:

放射性勘探技术

放射性勘探技术

当α=0.05时,查得t=1.96,又由于n=154是个大样本,于是可用样本标准差s代替总体标准差σ,则抽样误差是

放射性勘探技术

所以该岩体的放射性γ照射量率为(42.3±2.2)γ,也就是说,在信度为5%的条件下,该岩体放射性γ照射量率置信区间为(40.1γ,44.5γ)。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2021-10-15
参数估计

是统计推断统计的重要内容之一,就是在抽样及抽样分布基础上,根据样本统计量来推断我们所关心的总体参数。本回答被网友采纳
相似回答