医学统计学题库

更新时间:2024-04-11 12:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 绪论习题

一、选择题

1.统计工作和统计研究的全过程可分为以下步骤:(D)

A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料

2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.P?0.10

B. P?0.05或P?0.01 C. P?0.005

D.P?0.05 E. P?0.01 3~8

A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料

3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A)。

4.分别用两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C)资料。

6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。

7.某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料的类型是(D )。

8. 100名18岁男生的身高数据属于(C )。 二、问答题

1.举例说明总体与样本的概念.

答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。

3.简要阐述统计设计与统计分析的关系

答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

第二章 第二章统计描述习题

一、选择题

1.描述一组偏态分布资料的变异度,以(D )指标较好。 A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E. 方差

2.各观察值均加(或减)同一数后(B )。

A. 均数不变,标准差改变 B. 均数改变,标准差不变

C. 两者均不变 D. 两者均改变 E. 以上都不对 3.偏态分布宜用(C )描述其分布的集中趋势。

A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 方差

4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是(E )。

A.标准差 B.标准误 C.全距 D.四分位数间距 E.变异系数 5.测量了某地152人接种某疫苗后的抗体滴度,宜用(C )反映其平均滴度。 A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数 6.测量了某地237人晨尿中氟含量(mg/L),结果如下:

尿氟值:0.2~ 0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~ 频 数: 75 67 30 20 16 19 6 2 1 1 宜用(B )描述该资料。

A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差

7.用均数和标准差可以全面描述(C )资料的特征。

A. 正偏态资料 B. 负偏态分布 C. 正态分布 D. 对称分布 E. 对数正态分布

8.比较身高和体重两组数据变异度大小宜采用(A )。 A. 变异系数 B. 方差 C. 极差 D. 标准差 E. 四分位数间距

9.血清学滴度资料最常用来表示其平均水平的指标是(C )。 A. 算术平均数 B. 中位数 C. 几何均数

D. 变异系数 E. 标准差

10.最小组段无下限或最大组段无上限的频数分布资料,可用(C )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 几何均数

11.现有某种沙门菌食物中毒患者164例的潜伏期资料,宜用(B )描述该资料。

A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差

12.测量了某地68人接种某疫苗后的抗体滴度,宜用(C )反映其平均滴度。 A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数 二、分析题

1.请按照国际上对统计表的统一要求,修改下面有缺陷的统计表(不必加表头)

年龄 性别 例数 答案: 年龄组

性别

21~30

男 女

10 14

31~40 8 14

41~50 82 37

51~60 213 49

61~70 22 .

21-30 男 女 10 14 31-40 男 女 8 14 41-50 男 女 82 37 51-60 男 女 213 49 61-70 男 22

2.某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果列于表1。该医生对表中的资料进行了统计分析,认为男性肺癌的发病率高于女性,而死亡情况则完全相反。

表1 某社区不同性别人群肺癌情况

性别 男 女 合计

检查人数 1050 950 2000

有病人数

6 3 9

死亡人数

3 2 5

死亡率(%) 发病率(%)

50.0 66.7 55.6

0.57 0.32 0.45

1)该医生所选择的统计指标正确吗? 答:否

2)该医生对指标的计算方法恰当吗? 答:否

3)应该如何做适当的统计分析?

表1 某社区不同性别人群肺癌情况

性别 男 女 合计

检查人数 1050 950 2000

患病人数

6 3 9

死亡人数

3 2 5

死亡比(?) 现患率(?)

2.857 2.105 2.5

5.714 3.158 4.5

3.1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应的医院20.38,妇幼保健机构4.66,卫生院16.38,其他58.58。试说明用何种统计图表达上述资料最好。 答:例如,用柱状图表示:

706050403063.8458.58城市农村20.3820.7616.384.66医院妇幼保健机构7.637.7720100卫生院其他

第三章 抽样分布与参数估计习题

一、选择题

1.(E )分布的资料,均数等于中位数。

A. 对数 B. 正偏态 C. 负偏态 D. 偏态 E. 正态 2. 对数正态分布的原变量X是一种( D )分布。

A. 正态 B. 近似正态 C. 负偏态 D. 正偏态 E. 对称 3. 估计正常成年女性红细胞计数的95%医学参考值范围时,应用( A. )。 A.(x?1.96s,x?1.96s) B.(x?1.96sx,x?1.96sx)

?1.645slgx) ?1.645slgx)

D.?(x?1.645s)

C.?(xlgxE.?(xlgx4. 估计正常成年男性尿汞含量的95%医学参考值范围时,应用(E )。 A.(x?1.96s,x?1.96s) B.(x?1.96sx,x?1.96sx)

?1.645slgx) ?1.645slgx)

D.?(x?1.645s)

C.?(xlgxE.?(xlgx5.若某人群某疾病发生的阳性数X服从二项分布,则从该人群随机抽出n个人, 阳性数X不少于k人的概率为(A )。

A. P(k)?P(k?1)???P(n) B. P(k?1)?P(k?2)???P(n) C. P(0)?P(1)???P(k) D. P(0)?P(1)???P(k?1) E. P(1)?P(2)???P(k)

6.Piosson分布的标准差?和均数?的关系是( C )。

2A. ??? B. ??? C. ?=?

D. ?=? E. ?与?无固定关系

7.用计数器测得某放射性物质5分钟内发出的脉冲数为330个,据此可估计该放射性物质平均每分钟脉冲计数的

95%可信区间为(E )。

A. 330?1.96330 B. 330?2.58330 C. 33?1.9633 D. 33?2.5833 E. (330?1.96330)/5

8.Piosson分布的方差和均数分别记为?和?,当满足条件(E )时,Piosson 分布近似正态分布。

A. ?接近0或1 B. ?较小 C. ?较小 D. ?接近0.5 E. ?222?20

9.二项分布的图形取决于( C )的大小。

A. ? B. n C.n与? D. ? E. ? 10.(C )小,表示用该样本均数估计总体均数的可靠性大。

A.CV B.S C. ?X D. R E. 四分位数间距 11.在参数未知的正态总体中随机抽样,X???(E )的概率为5%。

A. 1.96? B. 1.96 C. 2.58 D. t0.05/2,?S E. t0.05/2,?SX

12.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其总体均

数的95%可信区间为(B )。

A. 74?2.58?4?10 B. 74?1.96?4?10 C. 74?2.58?4

D. 74?4?4 E. 74?1.96?4 13.一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数与标准差;估计该批药剂有效成分平均含量的95%可信区间时,应用(A )。

A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)

14.在某地按人口的1/20随机抽取1000人,对其检测汉坦病毒IgG抗体滴度,得肾综合征出血热阴性感染率为5.25%,估计该地人群肾综合征出血热阴性感染率的95%可信区间时,应用(E )。

A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)

15.在某地采用单纯随机抽样方法抽取10万人,进行一年伤害死亡回顾调查,得伤害死亡数为60人;估计该地每10万人平均伤害死亡数的95%可信区间时,应用(D )。

A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)

16.关于以0为中心的t分布,错误的是(A )。

A. 相同?时,t越大,P越大 B. t分布是单峰分布

B. 各处理组间的总体均数都不相等 C. 各处理组间的样本均数都不相等 D. 处理组的各样本均数间的差别均有显著性 E. 各处理组间的总体方差不全相等 4.随机区组设计方差分析的实例中有(E )。

A. SS处理不会小于SS区组 B. MS处理不会小于MS区组

C. F处理值不会小于1 D. F区组值不会小于1 E. F值不会是负数

5.完全随机设计方差分析中的组间均方是(C )的统计量。

A. 表示抽样误差大小 B. 表示某处理因素的效应作用大小 C. 表示某处理因素的效应和随机误差两者综合影响的结果。 D. 表示n个数据的离散程度 E. 表示随机因素的效应大小

6.完全随机设计资料,若满足正态性和方差齐性。要对两小样本均数的差别做 比较,可选择(A )。

A.完全随机设计的方差分析 B. u检验 C. 配对t检验 D.?2检验 E. 秩和检验

7.配对设计资料,若满足正态性和方差齐性。要对两样本均数的差别做比较,

可选择(A )。

A. 随机区组设计的方差分析 B. u检验 C. 成组t检验 D. ?2检验 E. 秩和检验

228.对k个组进行多个样本的方差齐性检验(Bartlett法),得???0.05,?,P?0.05按??0.05检验,可认为

(B )。

2222A. ?12,?2全不相等 B. ?12,?2不全相等 ,?,?k,?,?kC. S1,S2,?,Sk不全相等 D. X1,X2,?,Xk不全相等 E. ?1,?2,?,?k不全相等

9.变量变换中的对数变换(x?lgX或x?lg(X?1)),适用于(C ): A. 使服从Poisson分布的计数资料正态化

B. 使方差不齐的资料达到方差齐的要求 C. 使服从对数正态分布的资料正态化 D. 使轻度偏态的资料正态化

E. 使率较小(<30%)的二分类资料达到正态的要求 10.变量变换中的平方根变换(x?X或x?X?0.5),适用于(A ):

A. 使服从Poisson分布的计数资料或轻度偏态的资料正态化

B. 使服从对数正态分布的资料正态化 C. 使方差不齐的资料达到方差齐的要求 D. 使曲线直线化

E. 使率较大(>70%)的二分类资料达到正态的要求

二、简答题

1、方差分析的基本思想及应用条件

答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可有处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。 方差分析的应用条件:(1)各样本是相互独立的随机样本,均服从正态分布;(2)相互比较的各样本的总体方差相等,即具有方差齐性。

2、在完全随机设计资料的方差分析与随机区组设计资料的方差分析在试验设计和变异分解上有什么不同? 答:完全随机设计:采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理。在分析时,SS总?SS组间?SS组内

?SS处理?SS区组?SS组内

随机区组设计:随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在分析时,SS总3、为何多个均数的比较不能直接做两两比较的t检验?

答:多个均数的比较,如果直接做两两比较的t检验,每次比较允许犯第Ⅰ类错误的概率都是α,这样做多次t检验,就增加了犯第Ⅰ类错误的概率。因此多个均数的比较应该先做方差分析,若多个总体均数不全相等,再进一步进行多个样本均数间的多重比较

4、SNK-q检验和Dunnett-t检验都可用于均数的多重比较,它们有何不同? 答:SNK-q检验常用于探索性的研究,适用于每两个均数的比较

Duunett-t检验多用于证实性的研究,适用于k-1个实验组与对照组均数的比较。

三、计算题

1、某课题研究四种衣料内棉花吸附十硼氢量。每种衣料各做五次测量,所得数据如表5-1。试检验各种衣料棉花吸附十硼氢量有没有差异。

表5-1 各种衣料间棉花吸附十硼氢量 衣料1 2.33 2.00 2.93 2.73 2.33

衣料2 2.48 2.34 2.68 2.34 2.22

衣料3 3.06 3.06 3.00 2.66 3.06

衣料4 4.00 5.13 4.61 2.80 3.60

采用完全随机设计的方差分析,计算步骤如下: Ho:各个总体均数相等

H1:各个总体均数不相等或不全相等 α=0.05

表5-1 各种衣料间棉花吸附十硼氢量

衣料1

2.33 2.00 2.93 2.73 2.33 5

衣料2

2.48 2.34 2.68 2.34 2.22 5

衣料3

3.06 3.06 3.00 2.66 3.06 5

衣料4

4.00 5.13 4.61 2.80 3.60 5

合计

Xij

ni

20(N)

Xi Si

2.4640 0.3671

2.4120 0.1758

2.9680 0.1741

4.0280 0.9007

2.9680(X) 0.80990(S)

2SSS总=总*?总=0.80990 *(20-1)=12.4629,?总=20-1=19

2

SS组间??ni(Xi?X)i2

2=5(2.4640-2.9680)+5(2.4120-2.9680)

22

+5(2.9680-2.9680)+5(4.0280-2.9680)=8.4338,组间=4-1=3

2

?SS组间?SS总?SS组间=12.4629-8.4338=4.0292,?组内=20-4=16

MS组间?MS组内?SS组间SS组内?组间?组内?8.4338?4.02923=2.8113 16=0.2518

2.8113F==11.16 0.2518 方差分析表 变异来源 总 组间 组内

按1=3,2=16查F界值表,得F0.01(2,16)故P< 0.01。

按α=0.05水准,拒绝H0,接受H1,可以认为各种衣料中棉花吸附十硼氢量有差异。

2、研究中国各地区农村3岁儿童的血浆视黄醇水平,分成三个地区:沿海、内陆、西部,数据如下表,问三个地区农村3岁儿童的血浆视黄醇水平有无差异。

地区 沿海 内陆 西部

解:Ho:各个总体均数相等

H1:各个总体均数不相等或不全相等 α=0.0500

n 20 23 19 SS 12.4629 8.4338 4.0292

ν 19 3 16

MS 2.8113 0.2518

F 11.16

P <0.01

???7.51,F?11.16?7.51,

X

1.10 0.97 0.96

S

0.37 0.29 0.30

SS组间??ni(Xi?X)=0.2462,?组间=3-1=2

2iSS组内??(ni?1)Si=6.0713,?组内=62-3=59

2iMS组间?MS组内?SS组间SS组内?组间?组内?0.2462?6.07132=0.1231 59=0.1029

0.1231F==1.20 0.1029 方差分析结果 变异来源 总 组间 组内

按1=2,2=59查F界值表,得F0.05(2,59)SS 6.3175

0.2462 6.0713

ν 61 2 59

MS 0.1231 0.1029

F 1.20

P > 0.05

???3.93,F?1.20?3.93,

故P> 0.05。

按α=0.05水准尚不能拒绝Ho,故可以认为各组总体均数相等

3、将同性别、体重相近的同一配伍组的5只大鼠,分别用5种方法染尘,共有6个配伍组30只大鼠,测得的各鼠全肺湿重,见下表。问5种处理间的全肺湿重有无差别?

表5-2. 大鼠经5种方法染尘后全肺湿重 区组 第1区 第2区 第3区 第4区 第5区 第6区

对照 1.4 1.5 1.5 1.8 1.5 1.5

A组 3.3 3.6 4.3 4.1 4.2 3.3

B组 1.9 1.9 2.1 2.4 1.8 1.7

C组 1.8 2.3 2.3 2.5 1.8 2.4

D组 2.0 2.3 2.4 2.6 2.6 2.1

解:处理组间:

Ho:各个处理组的总体均数相等

H1:各个处理组的总体均数不相等或不全相等 α=0.05

区组间:

Ho:各个区组的总体均数相等

H1:各个区组的总体均数不相等或不全相等 α=0.05

表5-2. 大鼠经5种方法染尘后全肺湿重 区组

对照

A组 B组 C组 D组

nj Xj

第1区 第2区 第3区 第4区 第5区 第6区 1.4 1.5 1.5 1.8 1.5 1.5

6 1.5333 0.1366

3.3 3.6 4.3 4.1 4.2 3.3

6 3.8000 0.4561

1.9 1.9 2.1 2.4 1.8 1.7

6 1.9667 0.2503

1.8 2.3 2.3 2.5 1.8 2.4

6 2.1833 0.3061

2.0 2.3 2.4 2.6 2.6 2.1

6 2.3333 0.2503

5 5 5 5 5 5

30 2.3633 0.82816

2.0800 2.3200 2.5200 2.6800 2.3800 2.2000 (N) (X) (S)

ni

Xi Si

SS总??X2?(?X)2N =19.8897,?总=30-1=29

2SS处理组??ni(Xi?X)=17.6613, ?处理组=5-1=4

iSS区组??nj(Xj?X)=1.1697, ?区组=6-1=5

j2(6-1)=20 SS误差=19.8897-17.6613-1.1697=1.0587,?误差=(5-1)方差分析结果 变异来源 总

处理组 区组 误差

SS 19.8897 17.6613 1.1697 1.0587

ν 29 4 5 20

MS

4.4153 0.2339 0.0529

F

83.41 4.42

P

<0.01 <0.01

按1=4,2=20查F界值表,得F0.01(4,20)故P< 0.01。

???5.17,F?83.41?5.17,

按α=0.05水准,拒绝H0,接受H1,可以认为5种处理间的全肺湿重不全相等。 按1=5,2=20查F界值表,得F0.05(5,20)故P< 0.05。

按α=0.05水准,拒绝H0,接受H1,可以认为6种区组间的全肺湿重不全相等。

???3.29,F?4.42?3.29,

4、对第1题的资料进行均数间的多重比较。 解:采用SNK检验进行两两比较。

Ho: ?A??B,即任两对比较组的总体均数相等 H1: ?A??B,即任两对比较组的总体均数不相等 α=0.05

将四个样本均数由小到大排列,并编组次:

均数 2.4120 2.4640 2.9680 4.0280 组别 衣料2 衣料1 衣料3 衣料4 组次 1 2 3 4

4个样本均数两两比较的q检验(Newman-Keuls法) 对比组

两均数之差

组数 2 3 4 2 3 2

Q值 0.2317 2.4775 7.2008 2.2458 6.9691 4.7233

P值 >0.05 >0.05 <0.01 >0.05 <0.01 <0.05

1与2 0.0520 1与3 0.5560 1与4 1.6160 2与3 0.5040 2与4 1.5640 3与4 1.0600

按按α=0.05水准,1与4,2与4,3与4,拒绝H0,差异有统计学意义,其他两两比较不拒绝H0,差异无统计学意义。即衣料2与衣料4,衣料1与衣料4,衣料3与衣料4的棉花吸附十硼氢量有差异,还不能认为衣料1与衣料2,衣料2与衣料3,衣料1与衣料3的棉花吸附十硼氢量有差异。

第六章 分类资料的假设检验习题

一、选择题

1.?2分布的形状( D )。

A. 同正态分布 B. 同t分布 C.为对称分布 D. 与自由度?有关 E. 与样本含量n有关 2.四格表的自由度(B )。

A. 不一定等于1 B. 一定等于1 C. 等于行数×列数 D. 等于样本含量-1 E. 等于格子数-1

3.5个样本率作比较,???0.01,4,则在?=0.05的检验水准下,可认为(A )。

A. 各总体率不全相等 B. 各总体率均不等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等

4.测得某地6094人的两种血型系统,结果如下。欲研究两种血型系统之间是否有联系,应选择的统计分析方法是(B )。

某地6094人的ABO与MN血型 ABO血型

O

A B AB

222M 431 388 495 137

MN血型 N 490 410 587 179

MN 902 800 950 32

A.秩和检验 B.?检验 C.Ridit检验 D.相关分析 E.Kappa检验

5.假定两种方法检测结果的假阳性率和假阴性率均很低。现有50份血样用甲法检查阳性25份,用乙法检查阳性

35份,两法同为阳性和阴性的分别为23份和13份。欲比较两种方法检测结果的差别有无统计学意义,应选用( D )。

A. u检验 B. t检验 C. 配对t检验 D. 配对四格表资料的?2检验 E. 四格表资料的?2检验

6.某医师欲比较两种疗法治疗2型糖尿病的有效率有无差别,每组各观察了30例,应选用(C )。 A.两样本率比较的u检验 B.两样本均数比较的u检验 C. 四格表资料的?2检验 D. 配对四格表资料的?2检验 E. 四格表资料?2检验的校正公式

7.用大剂量Vit.E治疗产后缺乳,以安慰剂对照,观察结果如下:Vit.E组,有效12例,无效6例;安慰剂组有效3例,无效9例。分析该资料,应选用(D )。

A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式

8.欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果如下。分析该资料,应选用(D )。

两种药物治疗脑血管疾病有效率的比较

组 别 有效 无效 合计 胞磷胆碱组 46 6 52 神经节苷酯组 18 8 26 合 计 64 14 78

A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?检验校正公式

9.当四格表的周边合计数不变,若某格的实际频数有变化,则其理论频数( C )。 A. 增大 B. 减小 C. 不变 D. 不确定 E. 随该格实际频数的增减而增减

10.对于总合计数n为500的5个样本率的资料作?检验,其自由度为(D )。

A. 499 B. 496 C. 1 D. 4 E. 9

11.3个样本率作比较,???0.01,2,则在?=0.05的检验水准下,可认为(B )。

A. 各总体率均不等 B. 各总体率不全相等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等

12.某医院用三种方案治疗急性无黄疸性病毒肝炎254例,观察结果如下。欲比较三种方案的疗效有无差别,应选择的统计分析方法是(A )。

组 别

西药组 中药组

中西医结合组

22222无 效 49 45 15

三种方案治疗肝炎的疗效结果

好 转 显 效 31 5 9 22 28 11

痊 愈

15 4 20

A.秩和检验 B.?检验 C.t检验 D.u检验 E.Kappa检验

13.某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定:乳胶法阳性13例,免疫法阳性23例,两法同为阳性和阴性的分别为11例和33例。欲比较两种方法检测结果的差别有无

统计学意义,应选用(D )。

A. u检验 B. t检验 C. 配对t检验 D. 配对四格表资料的?2检验 E. 四格表资料的?2检验

14.某医师欲比较两种药物治疗高血压病的有效率有无差别,每组各观察了35例,应选用( C )。 A.两样本率比较的u检验 B.两样本均数比较的u检验 C.四格表资料的?2检验 D.配对四格表资料的?2检验 E. 四格表资料的?2检验校正公式

15.某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组(22例)和非预防组(11例),观察结果为:预防注射组感染率18.18%,非预防组感染率45.45%。分析该资料,应选用(D )。

A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式

16.用兰芩口服液治疗慢性咽炎患者34例,有效者31例;用银黄口服液治疗慢性咽炎患者26例,有效者18例。分析该资料,应选用( E )。

A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式 二、简答题

1.列出?2检验的用途?

答:推断两个总体率间或者构成比见有无差别;多个总体率间或构成比间有无差别;多个样本率比较的的?2分割;两个分类变量之间有无关联性以及频数分布拟合优度的?检验2.?检验的基本思想?

答:?2值反映了实际频数与理论频数的吻合程度,若检验假设H0成立,实际频数与理论频数的差值会小,则?2值也会小;反之,若检验假设H0不成立,实际频数与理论频数的差值会大,则?2值也会大。 3.四格表资料的?检验的分析思路?

22答:(1)当n?40且所有的T?5时,用?检验的基本公式或四格表资料?检验的专用公式;当p??时,改

222用四格表资料的Fisher确切概率法。

(A?T)2 基本公式:???

T2(ad?bc)2n 专用公式:???

(a?b)(c?d)(a?c)(b?d)22 (2)当n?40,但有1?T?5时,用四格表资料?检验的校正公式或改用四格表资料

的Fisher确切概率法

校正公式: ?c?2?(a?b)(c?d)(a?c)(b?d)

(ad?bc?n2)2n(3)当n?40,或T?1时,用四格表资料的Fisher确切概率法

三、问答题

1.R×C表的分析思路

1.答:R×C表可分为双向无序、单向有序、双向有序属性相同和双向有序属性不同四类 (1) 双向无序R×C表 R×C表中的两个分类变量皆为无序分类变量。对于该类资料 ① 若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的?2检验;

② 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的?2检验以及Pearson列联系数进行分析。

(2) 单向有序R×C表 有两种形式:一种是R×C表的分组变量是有序的,但指标变量是无序的,其研究目的通常是多个构成比的比较,此种单向有序R×C表可用行×列表资料的?2检验;另一种情况是R×C表中的分组变量为无序的,而指标变量是有序的。其研究目的通常是多个等级资料的比较,此种单向有序R×C表资料宜用秩和检验或Ridit分析。

(3) 双向有序属性相同R×C表 R×C表中的两分类变量皆为有序且属性相同。实际上是2×2配对设计的扩展,即水平数?3的诊断试验配伍设计。其研究目的通常是分析两种检验方法的一致性,此时宜用一致性检验(或称Kappa检验)。

(4) 双向有序属性不同R×C表 R×C表中两分类变量皆为有序的,但属性不同。对于该类资料:

① 若研究目的为分析不同年龄组患者疗效间有无差别时,可把它视为单项有序R×C表资料,选用秩和检验; ②若研究目的为分析两个有序分类变量间是否存在相关关系,宜用等级相关分析或Pearson积矩相关分析; ③ 若研究目的为分析两个有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。

四、计算题

1.据以往经验,新生儿染色体异常率一般为1%,某院观察了当地1000名新生儿,发现有5例染色体异常,问该地新生儿染色体异常率是否低于一般? 答:(1)建立检验假设,确定检验水准 H0:??0.01 H1:??0.01

单侧 ??0.05

(2)计算统计量u值,做出推断结论

本例?0?0.01,1??0?1?0.01?0.99,n?1000,根据题意

u?p??00.005?0.01???1.589

?0(1??0)n0.01?0.991000(3)确定P值,做出推断结论。

u??1.589,P>0.05,按??0.05的检验水准,不拒绝H0,尚不能认为该地新生儿染色体异常率低于一般

2.现用某种新药治疗患者400例,治愈369例,同时用传统药物治疗同类患者500例,477例治愈。试问两种药

物的治愈率是否相同? 答:(1)建立检验假设,确定检验水准

H0:?1??2 H1:?1??2

单侧 ??0.05

(2)计算统计量,做出推断结论

本例?0?0.01,p1?369/400?0.9225,p2?477/500?0.954,

pc?(369?477)/(400?500)?0.94,根据题意 u?p1?p20.9225?0.954???1.9773

1111pc(1?pc)(?)0.94?0.06?(?)n1n2400500(3)确定P值,做出推断结论。

u??1.9773,P<0.05,按??0.05的检验水准,拒绝H0,接受H1,可以认为这两种药物的治愈率不同。

3.某医院分别用单纯化疗和符合化疗的方法治疗两组病情相似的淋巴肿瘤患者,两组的缓解率如下表,问两疗法的总体缓解率是否不同?

两种疗法的缓解率的比较

组别 单纯化疗 复合化疗 合计

答:(1)建立检验假设,确定检验水准 H0:?1??2 两法总体缓解率相同 H1:?1??2 两法总体缓解率不同 双侧 ??0.05

(2)计算统计量,做出推断结论 本例n=58 ,最小理论频数TRC=2效果 缓解 15 18 33

未缓解 20 5 25

合计 35 23 58

缓解率(%) 42.86 78.26 56.90

23?25?9.914?4,用四格表资料的?2检验专用公式 58(15?5?18?20)2?58???7.094 ??1

35?23?33?25(3)确定P值,做出推断结论。

2?(0.05,1)?3.84 ,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认为两种治疗方案的总体缓解率

不同。

4.分别用对同一批口腔颌面部肿瘤患者定性检测唾液和血清中癌胚抗原的含量,得到结果如下表,问这两种方法的检测结果有无差别?

两种方法的检测结果

唾液

血清 合计

+

+ - 合计

答:(1)建立检验假设,确定检验水准 H0:B?C 两种方法的检测结果相同 H1:B?C 两种方法的检测结果不同 双侧 ??0.05

(2)计算统计量,做出推断结论

15 2 17

- 10 13 23

25 15 40

(10?2?1)2本例b+c=12<40,用配对四格表资料的?检验校正公式 ???4.083 ??1

10?222(3)确定P值,做出推断结论。

?2?4.083,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认为两种方法的检测结果不同。

5.测得250例颅内肿瘤患者的血清IL-8与MMP-9水平,结果如下表,问两种检测指标间是否存在关联?

血清IL-8与MMP-9水平

MMP-9 Ⅰ Ⅱ Ⅲ 合计

答:(1)建立检验假设,确定检验水准 H0: 两种检测指标间无关联 H1: 两种检测指标间有关联 双侧 ??0.05

(2)计算统计量,做出推断结论

IL-8

Ⅰ 22 18 0 40

Ⅱ 5 70 55 130

Ⅲ 0 20 60 80

合计 27 108 115 250

A2本例为双向无序R×C表,用式 ??n(??1) 求得

nRnC2??250(222227?40?5227?130108?40108?130108?80115?130115?80?182?702?202?552?602?1)?129.8??(3?1)?(3?1)?4

(3)确定P值,做出推断结论。

?2?129.8,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认为两种检测指标有关联,进一步计

算Pearson列联系数,以分析其关联密切程度。

?2 列联系数 rp??0.5846,可以认为两者关系密切。 2n??

第七章 非参数检验习题

一、 选择题

1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说(A )。 A.正秩和与负秩和的绝对值不会相差很大 B.正秩和与负秩和的绝对值相等 C.正秩和与负秩和的绝对值相差很大 D.不能得出结论 E.以上都不对

2.设配对资料的变量值为X1和X2,则配对资料的秩和检验是( E )。 A.把X1和X2的差数从小到大排序 B.分别按X1和X2从小到大排序 C.把X1和X2综合从小到大排序 D.把X1和X2的和数从小到大排序 E.把X1和X2的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点( D )。 A.不受总体分布的限制 B.适用于等级资料 C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料 4.等级资料的比较宜采用(A )。

A.秩和检验 B.F检验 C.t检验 D.?2检验 E.u检验

5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( D )。 A.两样本均数相同 B.两样本的中位数相同 C.两样本对应的总体均数相同 D.两样本对应的总体分布相同 E.两样本对应的总体均数不同

6.以下检验方法中,不属于非参数检验方法的是( E )。 A.Friedman检验 B.符号检验 C.Kruskal-Wallis检验 D.Wilcoxon检验 E.t检验

7.成组设计两样本比较的秩和检验中,描述不正确的是(C )。 A.将两组数据统一由小到大编秩

B.遇有相同数据,若在同一组,按顺序编秩 C.遇有相同数据,若不在同一组,按顺序编秩 D.遇有相同数据,若不在同一组,取其平均值

E.遇有相同数据,若在同一组,取平均致词 二、简答题

1.简要回答进行非参数统计检验的适用条件。 答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能

2. 你学过哪些设计的秩和检验,各有什么用途? 答:(1)配对设计的符号秩和检验(Wilcoxon配对法)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较;(2)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)用于完全随机设计的两个样本的比较,目的是推断两样本分别代表的总体分布是否吸纳共同。(3)成组设计多样本比较的秩和检验(Kruskal-Wallis检验),用于完全随机设计的多个样本的比较,目的是推断两样本分

别代表的总体的分布有无差别。(4)随机区组设计资料的秩和检验(Friedman检验),用于配伍组设计资料的比较。

3试写出非参数统计方法的主要优缺点 答:优点:(1)适用范围广,不受总体分布的限制;(2)对数据的要求不严;(3)方法简便,易于理解和掌握。 缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。

三、计算题

1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?

表7-1 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较

编号 仪器一 仪器二 1 100 120 2 121 130 3 220 225 4 186 200 5 195 190 6 150 148 7 165 180 8 170 171

解:

(1)建立检验假设,确定检验水准

H0:用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即Md?0 H1:Md?0

??0.05

(2)计算检验统计量T值

①求各对的差值 见表7-4第(4)栏。 ②编秩 见表7-4第(5)栏。

③求秩和并确定统计量T。T??5.5 T??30.5 取T?5.5。 (3)确定P值,做出推断结论

本例中n?8,T?5.5,查附表T界值表,得双侧P?0.05;按照??0.05检验水准,拒绝H0,接受H1。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。

表7-4 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较 编号 原法 新法 秩次 差值d (1) (2) (3) (4)=(2)—(3) (5) 1 100 120 -20 -8 2 121 130 -9 -5 3 220 225 -5 -3.5 4 186 200 -14 -6 5 195 190 5 3.5

6 7 8

150 165 170

148 180 171

2 -15 -1

2 -7 -1

T??5.5 T??30.5

2. 40名被动吸烟者和38名非被动吸烟者的碳氧血红蛋白HbCO(%)含量见表7-2。问被动吸烟者的HbCO(%)含量

是否高于非被动吸烟者的HbCO(%)含量?

表7-2 吸烟工人和不吸烟工人的HbCO(%)含量比较

含量 很低 低 中 偏高 高

解:

(1)建立检验假设,确定检验水准

被动吸烟者

1 8 16 10 4

非被动吸烟者

2 23 11 4 0

合计 3 31 27 14 4

H0:被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布相同 H1:被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布不同

??0.05

(2)计算检验统计量T值 ①编秩

②求秩和并检验统计量

T1?1909,T2?1237.5,n1?39,n2?40,故检验统计量T?1909,因n1?39,需要用u检验;又因等级资

料的相同秩次过多,故:

u?1909?39(79?1)2?0.539?40(79?1)123j3?3.417

(33?3)?(313?31)?(273?27)?(143?14)?(43?4)C?1??(t?tj)(N?N)?1??0.894 379?79uc?uC?3.4170.894?3.614

(3)确定P值,做出推断结论

uc?3.614?1.96

P?0.05,.05检验水准,按??0拒绝H0,接受H1,认为被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)

含量总体分布不同

表7-5 吸烟工人和不吸烟工人的HbCO(%)含量比较

含量 (1) 很低 低 中 偏高 高 合计

人数 秩和 秩次范

平均秩次 围 被动吸烟者 非被动吸烟者 合计 被动吸烟者 非被动吸烟者

(2) (3) (4) (5) (6) (7)=(2)×(6)(8) =(3)×(6) 1 2 3 1~3 2 2 4 8 23 31 4~34 19 152 437 16 11 27 34~61 47.5 760 522.5 10 4 14 62~75 68.5 685 274 4 0 4 76~79 77.5 310 0 39 40 79 — — 1909 1237.5

3. 受试者4人,每人穿四种不同的防护服时的收缩压值如表,问四种防护服对收缩压的影响有无显著差别?四

个受试者的收缩压值有无显著差别?

表7-3 四种防护服与收缩压值

受试者编号 防护服A 防护服B 防护服C 防护服D

1 2 3 4

解:

关于四种防护服对收缩压的影响: (1)建立检验假设,确定检验水准

115 122 110 120

135 125 130 115

140 135 136 120

135 120 130 130

H0:穿四种防护服后收缩压总体分布相同 H1:4个总体分布不同或不全相同

??0.05

(2)计算统计量M值

①编秩②求秩和并计算检验统计量

6?15?9.5?9.5?10,M?(6?10)2?(9.5?10)2?(15?10)2?(9.5?10)2?41.5

43)确定P值,做出推断结论 T?处理组数k?4,配伍组数b?4查表,M0.05(4,4)?52,M?41.5?52,P?0.05,按??0.05检验水准不拒

绝H0,尚不能认为不同防护服对收缩压影响有差别。

表7-5 关于四种防护服对收缩压的影响

受试者编号

1 2 3 4

防护服A 115 122 110 120

1 2 1 2 6

防护服B 135 125 135 115

2.5 3 3 1 9.5

防护服C 140 135 136 126

4 4 4 3 15

防护服D 135 120 130 130

2.5 1 2 4 9.5

收缩压 秩次 收缩压 秩次 收缩压 秩次 收缩压 秩次

Ti

关于四个受试者收缩压值的差别:

(1)建立检验假设,确定检验水准

H0:四个受试者的收缩压值没有差别 H1:四个受试者的收缩压值不同

??0.05

(2)计算统计量M值

①编秩②求秩和并计算检验统计量

T?13.5?9?10?7.5?10

4M?(13.5?10)2?(9?10)2?(10?10)2?(7.5?10)2?19.5

(3)确定P值,做出推断结论

处理组数k?4,配伍组数b?4查表,M0.05(4,4)?52,M?19.5?52,P?0.05,按??0.05检验水准不拒绝H0,尚不能认为四个受试者的收缩压值有差别。

表7-6 关于四个受试者收缩压值的差别

受试者编号

1 2 3 4

防护服A

防护服B

防护服C

防护服D

Ti

13.5 9 10 7.5

收缩压 秩次 收缩压 秩次 收缩压 秩次 收缩压 秩次 115 122 110 120

2 4 1 3

135 125 135 115

3.5 2 3.5 1

140 135 136 126

4 2 3 1

135 120 130 130

4 1 2.5 2.5

第八章 直线回归与相关习题

一、选择题

1.直线回归中,如果自变量X乘以一个不为0或1的常数,则有(B )。 A. 截距改变 B. 回归系数改变 C. 两者都改变 D. 两者都不改变 E. 以上情况都有可能 2.如果直线相关系数r?1,则一定有(C )。

A. SS总?SS残 B. SS残=SS回 C. SS总=SS回 D. SS总?SS回 E. 以上都不正确

3.相关系数r与决定系数r在含义上是有区别的,下面的几种表述,哪一种最正确?(D )。

A. r值的大小反映了两个变量之间是否有密切的关系 B. r值接近于零,表明两变量之间没有任何关系 C. r值接近于零,表明两变量之间有曲线关系 D. r值接近于零,表明直线回归的贡献很小

22

E. r值大小反映了两个变量之间呈直线关系的密切程度和方向 4.不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下:

地 区 编 号 1 2 3 碘含量(单位) 10.0 2.0 2.5 患病率(%) 40.5 37.7 39.0

4

3.5 20.0

?? ?? ??

17 24.5 0.0

2研究者欲通过碘含量来预测地方性甲状腺肿的患病率,应选用(B )。 A.相关分析 B.回归分析 C.等级相关分析 D.?2检验 E.t检验

5.直线回归中X与Y的标准差相等时,以下叙述( B )正确。 A. b?a B. b?r C. b?1

D. r?1 E. 以上都不正确

6.利用直线回归估计X值所对应Y值的均数可信区间时,(E )可减小区间长度。 A. 增加样本含量 B. 令X值接近其均数 C. 减小剩余标准差

D. 减小可信度 E. 以上都可以

7.有两组适合于作直线相关分析的实验资料(按专业知识都应取双侧检验),第1组资料:n1?5,r1?0.857;第2组资料:n2?8,r2?0.712。在没有详细资料和各种统计用表的条件下,可作出的结论是(A )。 A.缺少作出明确统计推断的依据 B.因n2?n1,故r2有显著性意义 C. 因r1?r2,故r1有显著性意义 D. r1、r2都有显著性意义 E. r1、r2都没有显著性意义

8.某监测站同时用极谱法和碘量法测定了水中溶解氧的含量,结果如下。若拟用极谱法替代碘量法测定水中溶解氧的含量,应选用(B )。

水 样 号 1 2 3 4 5 6 7 8 9 10

极谱法(微安值) 5.3 5.2 2.1 3.0 3.3 2.8 3.4 6.8 6.3 6.5 碘量法(mg/L) 5.85 5.80 0.33 1.96 2.77 1.58 2.32 7.79 7.56 7.98

A.相关分析 B.回归分析 C.等级相关分析

D.?2检验 E.t检验

9.对两个数值变量同时进行相关和回归分析,r有统计学意义(P?0.05),则(B)

A.b无统计学意义 B.b有统计学意义 C.不能肯定b有无统计学意义 D.以上都不是

10.某医师拟制作标准曲线,用光密度值来推测食品中亚硝酸盐的含量,应选用的统计方法是(B)

A.t检验 B.回归分析 C.相关分析 D.?检验 11.在直线回归分析中,回归系数b的绝对值越大(D)

A.所绘制散点越靠近回归线 B.所绘制散点越远离回归线 C.回归线对x轴越平坦 D.回归线对x轴越陡

12.根据观测结果,已建立y关于x的回归方程y?2.0?3.0x,x变化1个单位,y变化几个单位?(C)

2

A.1 B.2 C.3 D.5 13.直线回归系数假设检验t,其自由度为(A)

A. n?2 B.n?1 C.2n?1 D.2(n?1) E.n 二、简答题

1.详述直线回归分析的用途和分析步骤。

答:用途:①定量描述两变量之间的依存关系:对回归系数b进行假设检验时,若P??,可认为两变量间存在直线回归关系。②利用回归方程进行预测:把预报因子(即自变量X)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。③利用回归方程进行统计控制:规定Y值的变化,通过控制X的范围来实现统计控制的目标。

分析步骤:①首先控制散点图:若提示有直线趋势存在,可作直线回归分析;若提示无明显线性趋势,则根据散点图分布类型,选择合适的曲线模型,经数据变换后,化为线性回归来解决。若出现一些特大特小的异常点,应

lXY??bX?③对回归系数b进行假设检验:,a?YlXX方差分析,基本思想是将因变量Y的总变异SS总分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。t

??a?bX,其中:b?及时复核检查。②求出直线回归方程Y检验:基本思想是利用样本回归系数b与总体均数回归系数?进行比较来判断回归方程是否成立,实际应用中用r的检验来代替的检验。④直线回归方程的图示⑤回归方程拟合效果评价:决定系数R2如R?0.9说明回归能解释90%,此方程较好

2??y)(y???(y?y)22?SS回归SS总,

校正决定系数Radj⑥直线回归方程的区间估计:总体回归系数?的区间估计;?Y?的区间估计;个体值Y的容许区间

2.直线相关与直线回归的联系和区别。

答:区别:(1)资料要求不同 相关要求两个变量是双变量正态分布;回归要求应变量Y服从正态分布,而自变量X是能精确测量和严格控制的变量。(2)统计意义不同 相关反映两变量间的伴随关系这种关系是相互的,对等的;不一定有因果关系;回归则反映两变量间的依存关系,有自变量与应变量之分,一般将“因”或较易测定、变异较小者定为自变量。这种依存关系可能是因果关系或从属关系。(3)分析目的不同 相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出来;回归分析的目的则是把自变量与应变量间的关系用函数公式定量表达出来

联系:(1)变量间关系的方向一致 对同一资料,其r与b的正负号一致。 (2)假设检验等价 对同一样本,tr?tb,由于tb计算较复杂,实际中常以r的假设检验代替对b的检验。(3)r与b值可相互换算 b?r和回归可以相互解释

3.简述直线回归分析的含义,写出直线回归分析的一般表达式,试述该方程中各个符号的名称及意义。 答:直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。

一般表达式:Yi????Xi??i,Xi和Yi分别为第i个体的自变量和应变量取值。?称为截矩,为回归直线或其延长线与y轴交点的纵坐标。?称为回归直线的斜率。?i为误差。 4.写出直线回归分析的应用条件并进行简要的解释。 答:线性回归模型的前提条件是线性、独立、正态与等方差。

2lYY。(4)相关lXX

(1)线性是指任意给定的X所对应的应变量Y的总体均数与自变量X呈线性关系 (2)独立是指任意两个观察单位之间相互独立。否则会使参数估计值不够准确和精确。

(3)正态性是指对任意给定的X值,Y均服从正态分布,该正态分布的均数就是回归直线上与X值相对应的那个点的纵坐标。

(4)等方差是指在自变量X的取值范围内,不论X取什么值,Y都有相同的方差

5.什么是曲线拟合?它一般分为哪两类?答:曲线拟合是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。

曲线拟合一般分为两类:曲线直线化法和直接拟合曲线方程 三、计算题

1.某研究人员测定了12名健康妇女的年龄X(岁)和收缩压Y(KPa),测量数据见表1,

59

19.6

Y(KPa)

0

表8-1 12名健康妇女年龄和收缩压的测量数据 42 16.67

72 21.28

36 15.73

63 19.86

47 17.07

55 19.93

49 19.33

38 15.33

42 18.67

68 20.19

60 20.59

X(岁)

22,,,X?631X?34761Y?224.25Y?????4234.141,?XY?12026.77(1) 求X与Y之间的直线回归方程 解lXX??X2?(?X)2nn6312?34761??1580.92

12?12026.77?631?224.25?234.96 12lXY??XY?(?X)(?Y)X?52.58,Y?18.69 b?lXY234.96??0.149,a?Y?bX?18.69?0.149?52.58?10.856 lXX1580.92??10.856?0.149X. 故所求直线回归方程为Y(2)用方差分析的方法检验X与Y之间的直线关系是否存在? )H0:??0,即认为健康妇女的年龄与收缩压之间不存在直线关系 H1:??0,即认为健康妇女的年龄与收缩压之间存在直线关系 ??0.05 SS总?lYY??Y?2(?Y)2n224.252?4234.141??43.469,v总?n?1?11 12SS回归?blXY2lXY234.962???34.920,v回归?1 lXX1580.92SS剩余?SS总?SS回归?43.469?34.920?8.549,v剩余?n?2?10 F?

MS回归MS剩余?34.9201?40.85。 8.54910

由v1?1,v2?10查表得P?0.01,按??0.05的水准拒绝H0,接受H1。故可认为健康妇女的年龄与收缩压之间存在直线关系 (3)估计总体回归系数?的95%可信区间。 lXX1580.92(0.149?2.228?0.023,0.149?2.228?0.023)?(0.098,0.200) Sb?MS剩余?8.54910?0.023,t0.05/2,10?2.228,则总体回归系数?的95%可信区间为2.用A、B两种放射线分别局部照射家兔的某个部位,观察照射不同时间放射性急性皮肤损伤程度(见表8-2)。问由此而得的两样本回归系数相差是否显著? 表8-2 家兔皮肤损伤程度(评分)

2. 解:

(1)分别求出X与Y1、Y2之间的回归直线

时间(分)X 3 6 9 12 15 18 21

皮肤损伤程度

A Y1 1.0 2.5 3.6 10.0 15.3 25.0 32.3

B Y2 2.3 5.0 7.6 15.2 18.0 27.6 40.2

Y1~X:Y1?1.7929X?8.7,r2?0.9277(P?0.05)

??2.0155X?7.6286,r2?0.929(P?0.05) Y2~X:Y2(2) H0:?1??2?0 H1:?1??2?0

??0.05

(3) 计算t值:

估计误差平方和:

?(Y?Y?)??(Y?Y)111122?[?(X?X)(Y1?Y1)]2?(X?X)2?63.14

?(YS2c2?)??(Y?Y)??Y222221122[?(X?X)(Y2?Y2)]2?(X?X)2?78.25679

?)??(Y(Y?Y???)2?Y2(n1?2)?(n2?2)2c?14.139

Sb1?b2

??11??0.332 ?S??22???X1?X1???X2?X2????

A 计算死因别死亡率 B 计算年龄组死因死亡率 C 计算年龄组病死率 D 编制去死因寿命表 E 计算标准化死因死亡率

2. 在人口分析和人口预测时,经常需要确定人口的死亡率。但是,由于死亡率受社会、经济、文化及医疗卫生条件等诸因素的影响,存在一定的波动。同时,在一些人口资料不完整或人口数量太少的地区,也得不到有关的资料。这时,可以借助一些数理统计的方法,将世界各地的大量的寿命表汇集起来,进行分析,归纳出几种死亡模式,对各种模式按照其不同的平均预期寿命水平编制出一组寿命表,供人们参考,这种寿命表是:

A 队列寿命表 B 现时寿命表 C 简略寿命表 D 去死因寿命表 E 模型寿命表

3. 在寿命表中,用于评价居民健康水平的最优指标是:

A 生存人年总数 B 生存人年数 C 预期寿命 D 死亡概率 E 尚存人数 4. 寿命表的用途,不包括下列哪一项:

A 评价国家或地区居民健康水面 B 描述疾病的时间分布特征 C 进行人口预测 D 研究人口再生产状况 E 研究人群的生育、发育及疾病发展规律 5.生存分析中的生存时间为

A.确诊至死亡的时间 B.出院至失访的时间 C.手术至死亡的时间 D.观察开始至观察终止的时间 E. 观察开始至失访的时间

6. 关于肝癌治疗的随访资料作生存分析,可当作截尾值处理的是

A.死于肝癌 B.死于意外死亡 C.死于其它肿瘤 D.a.c都是 E. b.c都是 二、问答题:

1、生存资料中,截尾数据的含义及其出现的原因是什么? 2、Cox回归模型中,偏回归系数?i的意义是什么? 3、Cox回归模型与logistic回归模型相比有何不同? 三、计算题:

1、 为研究急性淋巴细胞性白血病病人的生存时间与其预后因素的关系,某研究者测得50例急性淋巴细胞性

白血病病人的生存时间(单位)及有关预后因素资料,x1为入院时白细胞数(?10/L),x2为淋巴结浸润度(分为0、1、2三级),x3为缓解出院后的巩固治疗(有巩固治疗时x3=1,否则x3=0),随访的终点事件是死于白血病,原始数据的整理格式见下表。试对此资料作cox回归分析。

表 急性淋巴细胞性白血病病人的生存时间与其预后因素数据 编号 1

2 3 4 5 6

9x1

2.50 1.20 173.00 3.50 119.00 39.70

x2

0.00 2.00 2.00 0.00 2.00 0.00

x3

0.00 0.00 0.00 0.00 0.00 0.00

时间 3.40 3.73 3.73 3.83 4.00 4.03

结局 1.00 1.00 1.00 1.00 1.00 1.00

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

10.00 62.40 502.20 2.40 4.00 34.70 14.40 28.40 2.00 0.90 40.00 30.60 6.60 5.80 21.40 6.10 2.80 2.70 2.50 4.70 6.00 128.00 3.50 35.00 62.20 2.00 10.80 8.50 21.60 2.00 2.00 2.00 3.40 4.30 5.10 244.80 2.40 4.00 1.70 5.10 1.10 32.00 12.80 1.40 2.00 0.00 2.00 0.00 0.00 0.00 0.00 2.00 2.00 0.00 2.00 2.00 0.00 0.00 2.00 0.00 0.00 2.00 0.00 0.00 0.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 2.00 0.00 0.00 2.00 0.00 0.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.00 0.00 1.00 1.00 1.00 0.00 1.00 0.00 0.00 0.00 1.00 1.00 0.00 0.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 4.17 4.20 4.20 5.00 5.27 5.67 7.07 7.26 7.33 7.53 7.53 7.60 7.67 7.67 8.30 8.33 8.33 8.80 9.23 11.00 11.77 11.83 11.83 11.97 13.16 14.83 15.17 18.23 18.23 19.16 20.17 20.17 20.17 20.57 21.00 21.87 23.77 26.00 28.33 31.33 37.77 66.83 73.57 124.17 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00 0.00 0.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00

本文来源:https://www.bwwdw.com/article/6scp.html

Top