统计学习题集

更新时间:2023-12-02 12:30:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.1

(1) R=278.8-104.2=174.6 174.6/10=17.46 取15为组距,

3020100100.0 - 115.0130.0 - 145.0160.0 - 175.0190.0 - 205.0220.0 - 235.0250.0 - 265.0280.0 - 295.0115.0 - 130.0145.0 - 160.0175.0 - 190.0205.0 - 220.0235.0 - 250.0265.0 - 280.0

3020100107.5122.5137.5152.5167.5182.5197.5212.5227.5242.5257.5272.5287.5 由频数表或直方图可知该资料近似正态分布 (2)

StatisticsVAR00001NMeanMedianStd. DeviationPercentilesValidMissing1010182.331178.80033.902117.720252.0752.597.5 CV?(5)

S?33.902/182.331?18.59% XX?1.96?S?182.331?1.96?33.902?115.88~24 (7)

x?X270?182.33u???2.586

S33.90?(?u)?0.0048?0.48%?0.5%

按95%参考值范围估计,该男子血清总胆固醇超出该范围,还有0.5%的人血清总胆固醇比他高。 习题集

1. 3

中位数的代表性较好,因为由频数表可知资料是偏态分布,而且非等比级资料

iMd?L?(n?50%?fm?)fm12?48?(25?19)?54.5411 1. 4

某地某年不同年龄组男童身高资料如下:

年龄组 1-2月 5-6月 3-3.5岁 5-5.5岁

人数 100 120 300 400

均数cm 56.3 66.5 96.1 107.8

标准差cm

2.1 2.2 3.1 3.3

问(1)上述资料是否表明6岁以下男童身高地均数和变异度均随年龄增长而增加?

(2)若以上各年龄组均服从正态分布,试估计上述300名3-3.5岁男童中身高在95.0-100.0范围内者有多少? (1)

错,由于各组均数相差悬殊,应根据变异系数来判断其离散程度 CV1=2.1/56.3=3.73% CV2=2.2/66.5=3.31%

CV3=3.1/96.1=3.23% CV4=3.3/107.8=3.06%

由上可见1-2月的男童身高的变异度最高 (2)

95.0?96.1u1???0.353.1

100.0?96.1u2??1.26

3.1查表得

?(u2)??(u1)?0.8962?0.3632?0.533,

300*0.533=159.9,即身高在95.0-100.0cm范围内者约有160人 1.5

某市1974年为了解该地居民发汞的基础水平,为汞污染地环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量如下: 某市238名健康人发汞含量如下表 发汞值(μg/g) 0.3- 0.7- 1.1- 1.5- 1.9- 2.3-

人数 20 66 60 48 18 16

2.7- 3.1- 3.5- 3.9-4.3 (1) (2)

6 1 0 3

说明此频数表的分布特征

计算均数和中位数,何者较大,为什么?何者用于说明本资料地集中趋势比较合适?

(3) (4) (5) (1)

用什么指标描述其离散趋势较好?

计算P2.5和P97.5,并与X±1.96s地范围比较。 估计该地居民发汞值的95%正常值范围。

观察值在0.3-4.3μg/g之间,频数最多在0.7-组段,频数大部分集中在数值较小的一侧,呈明显的正偏态分布 (2)

M =1.320μg/g ,X=1.428μg/g,均数较大 因为呈偏态分布,用中位数表示其集中趋势较合适 (3)

因为呈偏态分布,用四分位数间距表示其离散趋势较好。 QU-QL=1.771-0.939=0.832μg/g (4)

正态分布法所确定的范围为0.129——2.727 (μg/g)

百分位数法所确定的范围为0.419——2.970 (μg/g)

X±1.96s只能用于正态或近似正态分布资料,本资料为偏态分布,

百分位数法较为合理。由两法确定的范围差别较大。尤其是正态分布法所确定的下限为0.129,明显低于最小值。 (5)

发汞值只有过高才为异常,所以需要确定该值的95%的单侧上限值。用百分位数法得

P95=2.65μg/g,

即该地居民发汞的95%参考值范围为 <2.65μg/g 2. 1

某地调查部分健康成人的红细胞数和血红蛋白,结果如下

性别 男

红细胞数

女 男

血红蛋白

255

11.76

1.02

12.47

255 360

417.80 13.45

29.10 0.71

433.2 14.02

例数 360

均数 466.02

标准差 57.46

标准值 483.5

(1) 说明女性红细胞与血红蛋白地变异程度何者为大

(2) 分别计算男女两项指标的抽样误差 (3) 估计该地健康成年男女红细胞数的均数 (4) 男女间血红蛋白含量有无差别

(5) 男女两项指标是否均低于上表的标准值 答

(1)单位不同,应该用变异系数比较二者变异度。

红细胞CV=29.10/417.80=6.97% 血红蛋白CV=1.02/11.76=8.67% 所以女性血红蛋白的变异度较大 (2) 红细胞

抽样误差

sx?s/n?0.57.46/360?3.028

血红蛋白sx?s/n?0.17/360?0.037

女性抽样误差 红细胞

sx?s/n?29.1/255?1.800

血红蛋白(3)

sx?s/n?1.02/255?0.064

可用u0.05/2=1.96作为t0.05/2,v的估计,根据总体均数的95%可信区间公式

X?1.96SX

男性红细胞总体均数的95%可信区间

466.02?1.96?3.028?(460.08,471.96)

万/mm3

女性红细胞总体均数的95%可信区间

417.80?1.96?1.822?(414.23,421.37)万/mm3 (4)

用两个均数差的可信区间或两样本均数比较的t检验

22(360?1)0.71?(255?1)1.022sc??0.7263360?255?2

SX

1?X211?S(?)?0.726(0.0028?0.0039)?0.070n1n22C(X1?X2)?1.96sX1?X2=(13.45-11.76)±1.96*0.070 =(1.55,2.10)克%

不包含0,所以可以认为男性血红蛋白含量高于女性

t 值=24.2273,v=360+255-2=613,查t界值表,P<0.001,拒绝H0,接受H1,可认为该地男女血红蛋白含量有差别,男性血红蛋白含量高于女性。

(5)

可根据各个可信区间是否包含标准值或用样本均数与总体均数比较的t 检验进行判断

男性红细胞总体均数的95%可信区间

466.02?1.96?3.028?(460.08,471.96) 万/mm3

女性红细胞总体均数的95%可信区间

417.80?1.96?1.822?(414.23,421.37) 万/mm3

男性血红蛋白含量总体均数的95%可信区间

13.45?1.96?0.037?(13.38,13.52) (g%)

女性血红蛋白含量总体均数的95%可信区间

11.76?1.96?0.064?(11.62,11.90)(g%)

可知男女两项指标均低于标准值。

2.2

先对各滴度倒数进行对数变换,并求其均数X和标准差S

lg4?7lg8?10lg16?31lg32?33lg64?42lg128?24lg256?3lg512?X?152 =

0.6020?6.3216?12.0412?46.6596?59.6039?88.5028?57.7978?8.1278?3.0103152

=1.8597 S=0.44245

则几何均数 标准误

XG?lg?1X=72.39

sx?s/n?0.4425/152?0.03589

因n较大,可考虑用1.96近似替代t0.05/2,ν得

X?1.96SX?1.8597?1.96?0.03589?(1.79,1.93)

求反对数61.66~85.11

即平均滴度的点值估计为为1:72.39 总体均数95%可信区间为1:61.66~1:85.11 2.4

(1) 分别对甲药和乙药做配对t检验

甲 药

H0 : μd=0,即甲药用药前后血沉无差别,甲药无效 H1:μd≠0 ,即甲药有效 α=0.05

d?3.2,s=1.935,n=10,则

本文来源:https://www.bwwdw.com/article/d1tt.html

Top