统计学贾俊平_第四版课后习题答案2
3.3 某百货公司连续40天的商品销售额如下:
单位:万元
41 46 35 42
25 36 28 36
29 45 46 37
47 37 34 37
38 37 30 49
34 36 37 39
30 45 44 42
38 43 26 32
43 33 38 36
40 44 44 35
要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: K1lg40lgn()1.60206
,取116.32k=6
lg(2)lg20.30103
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5
(1) 对这个年龄分布作直方图;
(2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)
(2)年龄分布的特点:自学考试人员年龄的分布为右偏。
解:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):
要求:
(2)绘制第一、二、三产业国内生产总值的线图。
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15 要求:
(1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。 解:
Statistics
汽车销售数量 N
Valid Missing
Mean Median Mode Std. Deviation Percentiles
25 50 75
10 0 9.60 10.00 10 4.169 6.25 10.00 12.50
种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf 1.00 Extremes (=
Stem width: 1.00 Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
Mean Std. Deviation
7 0.714143
Variance 0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,均值小,离散程度小。
(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解:
Statistics
企业利润组中值Mi(万元) N
Valid Missing
Mean Std. Deviation Skewness
Std. Error of Skewness Kurtosis
Std. Error of Kurtosis
120 0
426.6667 116.48445
0.208 0.221 -0.625 0.438
17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大? (3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大? 解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身
高。
(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生
的平均体重为50kg,标准差为5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么?
女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。 都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05
磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? 计算标准分数:
Z1=
x5560x6560
==-1;Z2===1,根据经验规则,男生大约有68%s5s5
的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 计算标准分数:
Z1=
x4050x6050
==-2;Z2===2,根据经验规则,女生大约有95%s5s5
的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是
100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA=
x115100x425400
==1;ZB===0.5 ss1550
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低
于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
周六超出界限,失去控制。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预
期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计量来反映投资的风险? 标准差或者离散系数。
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 选择离散系数小的股票,则选择商业股票。
(3)如果进行股票投资,你会选择商业类股票还是高科技类股票? 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。
解:(1)方差或标准差;(2)商业类股票;(3)(略)。
7.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差等于多少?
(2) 在95%的置信水平下,允许误差是多少?
解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25, (1)样本均值的抽样标准差
σ
5=0.7906
(2)已知置信水平1-α=95%,得 Zα/2=1.96,
于是,允许误差是E
=Zα/2
σ
6×0.7906=1.5496。 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客
组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
=2.143 (2)在95%的置信水平下,求边际误差。
t,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z2 因此,tzz0.025=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为:
,=1204.2,1204.2=(115.8,124.2) 7.10
7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产
的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下:
已知食品包重量服从正态分布,要求:
(1)确定该种食品平均重量的95
%的置信区间。 解:大样本,总体方差未知,用z统计量
z
N0,1
样本均值=101.4,样本标准差s=1.829 置信区间:
zz2
2
1=0.95,z
2=z
0.025=1.96
zz22
=101.41.961.96=(100.89,101.91) (2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计
大样本,总体方差未知,用z统计量
z
N0,1
样本比率=(50-5)/50=0.9 置信区间:
pz2 pz21=0.95,z2=z
0.025=1.96
pz2
pz2
=(0.8168,0.9832) =0.91.961.96
7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了
假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%的置信区间。
解:小样本,总体方差未知,用t统计量
t
tn1
均值=13.56,样本标准差s=7.801 置信区间:
tn1tn1
2
1
=0.90,n=18,t
n1=t0.0517=1.7369
tn1tn12
=13.561.73691.7369=(10.36,16.75)
7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的
电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。
解:总体比率的估计
大样本,总体方差未知,用z统计量
z
N0,1
样本比率=0.23 置信区间:
pz2 pz21=0.90,z2=z
0.025=1.645
pz2
pz2
=0.231.6451.645=(0.1811,0.2789)
1=0.95,z2=z
0.025=1.96
pz2
pz2
=(0.1717,=0.231.961.960.2883)
7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约
为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:n
22z2
2
,1=0.95,z2=z0.025=1.96,
n
22z2
21.9621202
202
=138.3,取n=139或者140,或者150。
8. 1
8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,
测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著
性水平0.05下确定这批元件是否合格。 解:H0:μ≥700;H1:μ<700
已知:=680 =60
由于n=36>30,大样本,因此检验统计量:
z
=-2
当α=0.05,查表得z=1.645。因为z<-z,故拒绝原假设,接受备择假设,说明这批产
品不合格。
8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机
工作是否正常。某日开工后测得9包重量(单位:千克)如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)? 解:H0:μ=100;H1:μ≠100
经计算得:=99.9778 S=1.21221 检验统计量:
t
-0.055
2
当α=0.05,自由度n-1=9时,查表得t
9=2.262。因为t<t2,样本统计量落
在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。
8.5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50
袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)? 解:解:H0:π≤0.05;H1:π>0.05
已知: p=6/50=0.12 检验统计量:
Z
=2.271
当α=0.05,查表得z=1.645。因为z>z,样本统计量落在拒绝区域,故拒绝原假设,
接受备择假设,说明该批食品不能出厂。
8.7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)? 解:H0:μ≤225;H1:μ>225
经计算知:=241.5 s=98.726 检验统计量:
t
0.669
当α=0.05,自由度n-1=15时,查表得t15=1.753。因为t<t,样本统计量落在接
受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。 9.1 9.2 9.3 9.4 10.2 10.4
10.7 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果;
要求:
(1)完成上面的方差分析表。
(2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异? 解:(2)P=0.025>a=0.05,没有显著差异。
11.3 11.4
11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:
方差分析表
参数估计表
要求:
(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少?
(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。 解:(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。 (3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。 (5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。 回归直线的检验:p=2.17E—09<α,回归直线显著。 11.10
13.1 下表是1981年—1999年国家财政用于农业的支出额数据
(1)绘制时间序列图描述其形态。 (2)计算年平均增长率。
(3)根据年平均增长率预测2000年的支出额。
详细答案:
(1)时间序列图如下:
从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。
(2)年平均增长率为:
。
(3
)
。
13.2 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)
(1)绘制时间序列图描述其形态。
(2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案:
(1)时间序列图如下:
(2)2001年的预测值为:
|
(3)由Excel输出的指数平滑预测值如下表:
2001年a=0.3时的预测值为:
a=0.5时的预测值为:
比较误差平方可知,a=0.5更合适。
13.3 下面是一家旅馆过去18个月的营业额数据
(1)用3期移动平均法预测第19个月的营业额。
(2)采用指数平滑法,分别用平滑系数a=0.3、a=0.4和a=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适? (3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。 详细答案:
(1)第19个月的3期移动平均预测值为:
(2)
由Excel输出的指数平滑预测值如下表: a=0.3时的预测值:
,误差均方=87514.7。
a=0.4时的预测值:
,误差均方=62992.5.。
a=0.5时的预测值:
,误差均方=50236。
比较各误差平方可知,a=0.5更合适。
(3)根据最小二乘法,利用Excel输出的回归结果如下:
。估计标准误差
14.1 14.2
。
21
22