第三章 参数估计
第三章 参数估计
重点:
1. 总体参数与统计量
2. 样本均值与样本比例及其标准误差
难点:
1. 区间估计
2. 样本量的确定
知识点一:总体分布与总体参数
统计分析数据的方法包括:描述统计和推断统计(第一章)
推断统计是研究如何利用样本数据来推 断总体特征的统计学方法,包括参数估计和假设检验两大类。
总体分布是总体中所有观测值所形成的分布。
总体参数是对总体特征的某个概括性的度量。通常有
总体平均数( μ)
总体方差(σ )
总体比例( π)
知识点二:统计量和抽样分布
总体参数是未知的,但可以利用样本信息来推断。
统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。
统计量是样本的函数,如样本均值()、样本方差( s)、样本比例(p )等。
构成统计量的函数中不能包括未知因素。
由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。
[例题·单选题]以下为总体参数的是( )
a.样本均值b .样本方差
c.样本比例d .总体均值
答案:d
解析:总体参数是对总体特征的某个概括性的度量。通常有总体平均数、总体方差、总体比 例题·判断题:统计量是样本的函数。
答案:正确 22
解析:统计量是样本的函数,如样本均值()、样本方差(
量的函数中不能包括未知因素。 )、样本比例(p )等。构成统计
[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。
答案:错误
解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。。
(一)样本均值的抽样分布
设总体共有n 个元素,从中随机抽取一个容量为n 的样本,在重置抽样时,共有n 种抽法,即n
可以组成n 不同的样本,在不重复抽样时,共有n
个可能的样本。每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。
但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。 数理统计学的相关定理已经证明:
即样本均值的均值就是总体均值。
在重置抽样时,样本均值的方差为总体方
在不重置抽样时,样本均值的方差为
的1/n,即
其中,为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,n 比较大而n/n≥5% 时,修正系数可以简化为1-n/n,当n 比较大,而n/n
当总体服从正态分布时,样本均值一定服从正态分布,即有x~n(, ) 时,~n(, ) 若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30), 样本均值仍会接近
正态分布。样本分布的期望值为总体均值,样本方差
著名的中心极限定理。
为总体方差的1/n 。这就是统计上
该定理可以表述为:从均值为,
方差为的总体中,抽取样本量为n 的随机样本,当n 充分大时(通常要求n ≥30)
,样本均值的分布近似服从均值为, 方差为的正态分布。
如果总体不是正态分布,当n 为小样本时(通常n
[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有( )个样本
a.25 b.10 c.5 d.1
答案:a
解析:在重置抽样时,共有n 种抽法,共有样本n 个,即5=5×5=25个。
[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在不重置抽样时,共有( )个样本
a.25 b.10
c.5 d.1
答案:b n n 2
解析:在不重复抽样时,共
有个可能的样本。
即
(个)
(二)样本比例的抽样分布
比例是指具有某种属性的单位占全部单位数的比重。
总体比例(通常用 π表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据。
样本比例(通常用p 表示)是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的。描述所
有可能样本比例的概率分布就是样本比例的抽样分布。
当样本容量比较大时,样本比例p 近似服从正态分布,且有p 的数学期望就是总体比率π ,即σ(p)=π
而p 的方差与抽样方法有关,
在重置抽样下为,
在不重置抽样下为 即在重置抽样时, p的分布为p~n(, )
在不重置抽样时, p的分布为p~n(, )
一般讲,当 np≥5, 并n(1-p) ≥5时,就可以认为样本容量足够大。对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,当n 比较大,而n/n ≤ 5%时,修正系数
会趋向1,这时也可以按重置抽样计算方差。
从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高。
[例题·单选题]当样本容量比较大时,在重置抽样条件下,样本比例p 的方差为( ) a. 答案:a b. c. d.
解析:当样本容量比较大时,在重置抽样条件下,样本比例p
的方差为
[例题·单选题]设一个总体含有3个可能元素,取值分别为1,2,3。从该总体中采取重复抽样方法抽取样本量为2的所有可能样本,样本均值为2的概率值是( )
a .1/9 b.2/9 c.1/3 d. 4/9
答案:c
解析:在重复抽样下,样本为1,2,3的概率都是1/3。
[例题·判断题] 样本容量是指从一个总体中可能抽取的样本个数。
答案:错误
解析:样本容量是样本中个体的数目。一个总体可以有多个样本,各个样本的的容量可以相同可以不同。
[例题·判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为 0.5。 答案:正确
知识点三:统计量的标准误差
统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。
样本均值的标准误计算公式为:
当总体标准差 σ未知时,可用样本标准差s 代替计算,这时计算的标准误差称为估计标准误差。
相应地,样本比例的标准误计算公式为
同样,当总体比例的方差π(1-π )未知时,可用样本比例的方差p(1-p)代替。
[例题·单选题] 样本均值的标准误差计算公式为( ) a. b. c.
d.
答案:b
解析:样本均值的标准误差计算公式为
[例题·单选题]样本比例的标准误差计算公式为( ) a. b. c. d.
答案:a
解析:样本比例的标准误差计算公式为
[例题·单选题]统计量的标准误差也称为标准误,其大小与()。
a. 样本量的平方根成反比 b. 样本量的大小成反比
c. 样本量的大小成正比 d. 总体的标准差成反比
答案:a 解析:样本均值的标准误计算公式为:
成反比。 ,标准误与标准差成正比,与样本量的平方根
[例题·多选题]在参数估计中统计量的标准误差可用于()
a. 衡量样本统计量与总体参数之间的差距
b. 衡量样本统计量的离散程度
c. 衡量样本统计量的集中程度
d. 衡量总体参数的离散程度
e. 衡量总体参数的集中程度。
答案:ab
解析:统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。
第二节 参数估计
知识点一:点估计与区间估计
一.点估计与区间估计
参数估计是用样本统计量去估计总体的参数。
用样本统计量来估计总体参数有两种方法:点估计和区间估计
点估计:是用样本统计量的实现值来近似相应的总体参数。
区间估计:是根据估计可靠程度的要求,利用随机抽取的样本的统计量确定能够覆盖总体参数的可能区间的一种估计方法。
区间估计是包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,
可以对统计量与总体参数的接近程度给出一个概率度量。
标准正态分布为n (0,1)分布,将概率分布标准化的公式为:
=
将z
所对应的概率称为置信度或置信水平,将
几个概率下的置信区间: 表示的范围称为置信区间。
1. 以68.73%的置信水平推断总体参数推断总体参数μ的置信区间为(z=1) ()
2. 以95.45%的置信水平推断总体参数推断总体参数μ 的置信区间为(z=2) ()
3. 以99.73%的置信水平推断总体参数推断总体参数μ的置信区间为(z=3) ()
4. 还有一个95%的概率度为z=1.96 ()
[例题·多选题]由样本统计量来估计总体参数的方法有( )
a. 点估计 b.区间估计 c.假设检验
d. 近似估计 e.抽样估计
答案:ab
解析:用样本统计量来估计总体参数有两种方法:点估计和区间估计
[例题·单选题]以68. 27%的置信水平推断总体参数的置信区间为
a. b. c. 答案:a d.
解析:68.27%的置信水平, 其置信度为1,则置信区间为
知识点二:评价估计量的标准
用于估计总体参数的估计量可以有很多,如何选择估计效果最好的那种估计量,评价估计量的好坏的标准具体有:
1. 无偏性,是指估计量抽样分布的期望值等于被估计的总体参数。e
()=
2. 有效性,是指估计量的方差尽可能小。对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。
3.
一致性,是指随着样本量的增大,标准误
体的参数。
[例题·多选题]评价估计量的标准为( )。 越小,点估计量的值越来越接近被估计总
a .一致性 b.无偏性 c.显著性
d .有效性 e.综合性
答案:abd
解析:评价估计量的标准为:一致性、无偏性、有效性。
[例题·多选题]样本均值是总体均值的( )
a. 无偏估计量 b.一致估计量 c.有偏估计量
d. 无效估计 e.近似估计量
答案:ab
解析:从无偏性和一致性来看,样本均值是总体均值的无偏估计量 、一致估计量。 知识点三:一个总体均值的区间估计
在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知,用于估计的样本是大样本(n ≥30)还是小样本(n
一般将置信水平表示为1- a ,统计量分布两侧面积各为 a /2的分位数值,它取决于事先所要求的置信度(或可靠程度)。因此总体均值在1- a 置信水平下的置信区间可一般性地表达为: (-分位数值
*
的标准误差,+分位数值
*的标准误差)
(一)大样本的估计
大样本(n
≥30)情况下,当总体方差
已知时,总体均值在1-置信水平下的置信区间
为() 为置信水平;式中:为事先确定的一个概率值,它是总体均值不包括在置信区间的概率 ;1-为标准正态分布上两侧面积各为/2时的z 值;为估计误差。
大样本情况下,当总体方差
未知时,上式中的
可以用样本方差
代替,总体均值在1-
置信水平下的置信区间为()
[例题·单选题]以95. 45%的置信水平推断总体参数的置信区间为 a. b. c. 答案:b d.
解析:95.45%的置信水平,其置信度为2,则置信区间为
(二)小样本的估计
小样本(n
(1
)当总体方差
已知时,样本均值经过标准化后仍服从标准正态分布,此时总体均值在1-
置信水平下的置信区间仍为()
(2)如果总体方差未知时,样本均值经过标准化后仍服从自由度为(n-1)的t
分布,即
。t 分布也是对称分布,只不过计算出来的t 值对应的概率要查t 分布概
率表。总体均值在1-
置信水平下的置信区间为() 总体均值的置信区间是由样本均值和估计误差两部分组成的。
[例题·单选题]小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平 a. b. c. 答案:a d.
解析:小样本(n
)情况下,当总体方差
分布,此时总体均值在1-已知时,样本均值经过标准化后仍服从标准正态
置信水平下的置信区间仍为
()
[例题·单选题]小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平 a. b. c. 答案:a
d.
解析:小样本情况下,如果总体方差未知时,总体均值在置信水平(1-a )下的置信区间为
()
[例题·单选题]在其他条件不变的情况下,提高抽样推断的置信度,抽样误差范围会()。 a. 不变 b. 变小 c. 变大 d. 不能确定
答案:c
解析:估计误差
,当抽样推断的置信度提高,为变大,范围会变大。 知识点四:一个总体比例的区间估计
在大样本(n ≥30)情况下,当总体比例已知时,在1-置信水平下,总体比例的置信区间
为( ,)
未知时,在1-置信水平下,总体比例的置信区间
在大样本(n ≥30)情况下,当总体比例
为()
总体比例的置信区间是由样本比例和估计误差两部分组成的。
[例题·单选题]根据随机抽样调查资料,某企业工人生产定额平均完成 103%,标准误为 1%,置信度为 95.45%时,可以推断该企业工人的生产定额平均完成百分比()。
a. 小于 101% b. 大于 105%
c. 在 102%—104%之间 d. 在 101%—105%之间
答案:d
解析:估计误差=2*1%,则103%±2%,范围为(101%,105%) [例题·判断题]当np ≥5, 并且n(1-p) ≥5时, 就可以认为样本容量足够大,
样本比例近似服从正态分布。
答案:正确
解析:在大样本条件下,根据中心极限定理,若np ≥5,n(1-p) ≥5,则二项分布可用正态分布近似。
第三节 样本量的确定
知识点一:估计总体均值时样本量的确定
总体均值的置信区间是由样本均值和估计误差两部分组成的。
1. 在重置抽样条件下,设e 代表允许的估计误差,则样本量计算公式为:
如果总体标准差σ
未知,可以用样本标准差s
来代替;也可以用试验调查的办法,选择一个初始样本,以该样本的标准差s 作为总体标准差σ的估计值。
样本量与置信水平成正比,与总体方差成正比,与允许的估计误差的平方成反比。
[例题·计算题]对某大学的消费支出进行估计,已知该校的大学生消费支出的标准差为300元,现在想要估计消费支出95%的置信区间,允许的估计误差不超过30元,则应抽取多大的样本量? 解:已知σ=300,e=30,z α/2=1.96.则
==384.16≈385人
即应抽取385人作为样本。(注意,不是四舍五入)
[例题·多选题]决定样本量大小的因素有( )
a. 置信水平 b.总体方差 c.允许的估计误差
d. 总体均值 e.总体比例
答案:abc
解析:在重置抽样条件下,设e
代表允许的估计误差,则样本量计算公式为:
[例题·判断题]样本量与置信水平成正比,与总体方差成反比,与允许的估计误差成正比. ( ) 答案:错误
解析:样本量
的估计误差的平方成反比. ,样本量与置信水平的平方成正比,与总体方差成正比,与允许
知识点二:估计总体比例时样本量的确定
在重置抽样条件下,设e
代表允许的估计误差,则样本量计算公式为:
样本量越大,估计误差就越小,估计的精度就越高。
估计误差由使用者预先确定。
大多数情况下,估计误差的取值一般应小于0.1.
如果总体比例π 的值不知道,可以用样本比例s 来代替,或者取π =0.5,使得 π (1- π )达到最大。
[例题·计算题]某冷库对贮藏一批禽蛋的变质率进行抽样调查,根据以前的资料,禽蛋贮藏期变质率为5.3%。4.9%,现在允许误差不超过5%,推断的置信水平为95%,问至少要抽取多少禽蛋进行检查?
解:已知π1=5.3%,π2=4.9%,e=5%,z α/2=1.96.
因为:π1(1-π1)=0.053χ(1-0.053)=0.050
π2(1-π2)=0.049χ(1-0.049)=0.047,选方差最大的0.050,则
=
即应抽取77个禽蛋作为样本。 =76.83≈77个
[例题·多选题]计算样本容量,如果总体比例的值未知,可以( )
a. 用样本比例来代替
b. 取总体比例值为0.5,使得π (1- π ) 达到最大
c. 取总体比例值为0.1,使得π (1- π ) 达到最大
d. 取总体比例值为0.2,使得π (1- π ) 达到最小
e. 取总体比例值为0.3,使得π (1- π ) 达到最小
答案:ab
解析:计算样本容量,如果总体比例的值未知,大多数情况下,估计误差的取值一般应小于0.1. 如果总体比例π的值不知道,可以用样本比例s 来代替,或者取 π =0.5,使得 π (1- π )达到最大。 [例题·判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为 0.5。 答案:正确
解析:取 π =0.5,使得 π (1- π )达到最大