如何写论文?写好论文?免费论文网提供各类免费论文写作素材!
当前位置:免费论文网 > 范文百科 > 医学统计学试卷

医学统计学试卷

来源:免费论文网 | 时间:2017-01-23 06:55:25 | 移动端:医学统计学试卷

篇一:医学统计学试题及答案

医学统计学

一、选择题

1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B )

A 条图B 百分条图或圆图 C线图D直方图

2、均数和标准差可全面描述 D 资料的特征

A 所有分布形式 B负偏态分布 C 正偏态分布 D 正态分布和近似正态分布

3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )

A 用该市五岁男孩的身高的95%或99%正常值范围来评价

B 用身高差别的假设检验来评价

C 用身高均数的95%或99%的可信区间来评价

D 不能作评价

4、比较身高与体重两组数据变异大小宜采用( A)

A 变异系数 B 方差 C 标准差 D 四分位间距

5、产生均数有抽样误差的根本原因是(A )

A.个体差异 B. 群体差异C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A)

(A)相对比(B) 构成比(C)定基比(D)率

7、统计推断的内容为( D)

A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设”

C. A和B均不是D. A和B均是

8、两样本均数比较用t检验,其目的是检验(C )

A两样本均数是否不同B两总体均数是否不同

C两个总体均数是否相同 D两个样本均数是否相同

9、 有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )

(A) n1+ n2

(B) n1+ n2 –1

(C) n1+ n2 +1

(D) n1+ n2 -2

10、标准误反映( A )

A 抽样误差的大小 B总体参数的波动大小

C 重复实验准确度的高低 D 数据的离散程度

11、最小二乘法是指各实测点到回归直线的 (C)

A垂直距离的平方和最小 B垂直距离最小

C纵向距离的平方和最小 D 纵向距离最小

12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C)

A tr>tb B tr<tbC tr= tbD二者大小关系不能肯定

13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )

A分别按x1和x2从小到大编秩

B把x1和x2综合从小到大编秩

C把x1和x2综合按绝对值从小到大编秩

D把x1和x2的差数按绝对值从小到大编秩

14、四个样本率作比较,χ2>χ20.05,ν可认为( A )

A各总体率不同或不全相同B各总体率均不相同

C各样本率均不相同D各样本率不同或不全相同

15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A )

A.四格表 检验 B. 四格表校正 检验 Ct检验DU检验

16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着( D )

A 南方和北方女婴出生体重的差别无统计学意义

B 南方和北方女婴出生体重差别很大

C 由于P值太小,南方和北方女婴出生体重差别无意义

D 南方和北方女婴出生体重差别有统计学意义但无实际意义。

17、两个样本率比较的四格表 检验,差别有统计学意义,这个差别是指(A )

A 两个样本率的差别B 两个样本率的标准误

C 两个总体率的差别D 两个总体率的标准差

18. 下列指标不属于相对数的是( D)

A 率 B 构成比C 比D百分位数

19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:( D )

表1 盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效

组别 治愈 显效 进步 无效 合计

左西替利嗪片组 49 8 5 2 64

西替利嗪片组 44 10 9 3 66

A. 检验 B. 成组t检验 C. u检验 D. 秩和检验

20、下列哪种说法是错误的( B )

A 计算相对数尤其是率时应有足够的观察单位或观察次数

B分析大样本数据时可以构成比代替率

C 应分别将分子和分母合计求合计率或平均率

D 样本率或构成比的比较应作假设检验

二、填空题

1、现有若干名儿童健康检查一览表的部分检测指标,见表2

某年某地儿童健康检查部分检测结果

编性年龄(周身高(cm) 坐高(cm) 血型 表面抗 肝大

号 别 岁) 原

1 男 7 116.7 66.3 A + ++

2 女 8 120.0 68.3 AB - -

3 女 10 126.8 71.5 O - +

4 男 9 123.7 70.0 A - -

. . . . . . . .

. . . . . . . .

问:

①上述变量中能形成计数资料的指标有 性别,年龄,血型性别、血型、表抗

②计量资料的指标有 身高坐高 年龄、身高、体重

③等级资料的指标有 表面抗体 肝大肝大

④对于身高或坐高指标,在进行统计描述时宜计算 均数 和标准差 均数 和 标准差 表

示其集中趋势和离散趋势。

⑤对于血型指标宜计算 构成比 率 构成比表示各种血型的构成

⑥若要分析不同性别身高有无不同,宜选用的统计方法有 成组t 检验两样本均数比较的t检验

⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有 卡方检验 卡方检验

2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为341.48/10万

3、临床上安排试验设计时,应考虑的三个基本原则是 对照 随机 重复

三、简答题

1、描述集中趋势的指标有哪些?其适用范围有何异同?

均数:正态或近似正态分布

几何均数:等比数列或对数正态分布资料

中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。

2、何谓假设检验?可以举例说明。

首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。

由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。

4、请你谈谈标准差和标准误的异同点。

四、计算分析题10分*2=20

1、请将下列数据编制成合格的统计分析表。

表组别 总例数 感染例数 百分比,%

庆大霉素(8万单位/10毫30 1 3.3

升)

新洁尔灭(0.1%) 30 3 10

生理盐水冲洗服四环素330

生理盐水冲洗 30 5 8 16.7 26.7

2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。 某医院门诊沙眼病人年龄构成比

年龄组(岁) 0- 10- 20- 30- 40- 50- 60- 70- 计

沙眼人数 47 198 330 198 128 80 38 8 1027

沙眼百分比(%) 4.6 19.3 32.1 19.3 12.4 7.8 3.7 0.8 100.0

问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标?

答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。

篇二:医学统计学模拟试卷及答案

)

第一套试卷及参考答案 一、选择题 (40分)

1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B) A条图 B百分条图或圆图C线图 D直方图 2、均数和标准差可全面描述 D资料的特征

A 所有分布形式 B负偏态分布 C 正偏态分布 D 正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A)A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价

C用身高均数的95%或99%的可信区间来评价D不能作评价

4、比较身高与体重两组数据变异大小宜采用(A )

A 变异系数B方差 C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A )

A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )

(A)相对比 (B) 构成比 (C)定基比 (D)率 7、统计推断的内容为( D )

A.用样本指标估计相应的总体指标B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C)

A两样本均数是否不同 B两总体均数是否不同

C两个总体均数是否相同D两个样本均数是否相同

9、 有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )

(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A)

A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小 B垂直距离最小

C纵向距离的平方和最小 D 纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系

数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C)

A tr>tbB tr<tb C tr= tb D二者大小关系不能肯定

13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D ) A分别按x1和x2从小到大编秩 B把x1和x2综合从小到大编秩 C把x1和x2综合按绝对值从小到大编秩 D把x1和x2的差数按绝对值从小到大编秩 14、四个样本率作比较,χ>χ

2

20.05,ν

可认为( A)

A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同 D各样本率不同或不全相同

15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4

人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表pearson卡方检验B.四格表校正卡方检验C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方

n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着( D )

A南方和北方女婴出生体重的差别无统计学意义 B南方和北方女婴出生体重差别很大

C由于P值太小,南方和北方女婴出生体重差别无意义 D南方和北方女婴出生体重差别有统计学意义但无实际意义。

17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(AC) A两个样本率的差别 B两个样本率的标准误 C两个总体率的差别 D两个总体率的标准差 18.下列指标不属于相对数的是( D )

A率 B构成比 C比 D百分位数

19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:(D )

A.检验 B.成组t检验 C. u检验 D.秩和检验 20、下列哪种说法是错误的( B)

A计算相对数尤其是率时应有足够的观察单位或观察次数 B分析大样本数据时可以构成比代替率 C应分别将分子和分母合计求合计率或平均率 D样本率或构成比的比较应作假设检验 二、填空题(20分)

1、现有若干名儿童健康检查一览表的部分检测指标,见表2

问:

①上述变量中能形成计数资料的指标有性别、血型、表抗 ②计量资料的指标有 年龄、身高、体重 ③等级资料的指标有 肝大

④对于身高或坐高指标,在进行统计描述时宜计算 均数 和 标准差 表示其集中趋势和离散趋势。

⑤对于血型指标宜计算 构成比 表示各种血型的构成

⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的t检验 ⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有 卡方检验 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为341.48/10万 3、临床上安排试验设计时,应考虑的三个基本原则是对照 随机 重复 三、简答题(20分)

1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分) 均数: 正态或近似正态分布

几何均数:等比数列或对数正态分布资料

中位数:资料是偏态分布的;分布不规则; 一端或两端有不确定数据(开口资料)时。 2、何谓假设检验?可以举例说明。(5分)

首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该无效假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。(5分)

由于假设检验的结论是依据小概率事件一次试验可以认为不会发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5分)

四、计算分析题10分*2=20

1、请将下列数据编制成合格的统计分析表。

2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。

某医院门诊沙眼病人年龄构成比

问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标?

答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。

第二套试卷及参考答案 一、最佳选择题(40分)

1.均数是表示变量值_A_水平的指标。

(A) 平均 (B)变化范围(C)频数分布(D)相互间差别大小

2.原始数据同乘以一个不等于0的常数后_D_。

(A) 均数不变、标准差变(B)均数、标准差均不变 (C)均数变、标准差不变 (D)均数、标准差均变

3.描述正态或近似正态分布资料特征的是__B____。

(A)中位数、四分位间距(B)均数、标准差 (C)中位数、标准差 (D)几何均数、全距

4.描述偏态分布资料特征的是_A__。

(A)中位数、四分位间距 (B)均数、标准差 (C)中位数、标准差 (D)几何均数、全距

5.均数与标准差计算的数值 A 。

(A)均数可以是负数,标准差不可以 (B)均数不可以是负数,标准差可以 (C)两者都可以是负数 (D)两者都不可以是负数 6、 比较身高和体重两组资料的变异度大小宜采用___C___。

(A) 极差 (B)标准差 (C)变异系数 (D)四分位间距

7.说明某事物内部各组成部分所占比例应选_B___。

(A) 率 (B)构成比 (C)相对比 (D)标准差

8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。

(A)S(B)R (C)CV (D)

9.已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标

的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是 C

(A)5 (B)28 (C)29 (D)4

10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为A

(A)95% (B)49.5% (C)99%(D)97%

11.两样本均数间的差别的假设检验时,查t界值表的自由度为C

(A)n-1 (B)(r-1)(c-1) (C)n1+n2-2 (D)1

12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A

(A)总体中个体值存在差别 (B)样本中个体值存在差别 (C)样本只含总体的一部分 (D)总体均数不等于0

13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小 B

(A)α=0.05(B)α=0.20 (C) α=0.01 (D)α=0.10

14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C。 (A)线图 (B)条图(C)半对数线图(D)圆图 15.构成比用来 C

(A) 反映某现象发生的强度 (B) 表示两个同类指标的比

(C) 反映某事物内部各部分占全部的比重 (D) 表示某一现象在时间顺序的排列

16.某医院的资料计算各种疾病所占的比例,该指标为 D

(A)发病率 (B)患病率 (C)相对比 (D)构成比 17.等级资料的比较宜用 C

(A) t检验 (B)检验 (C)秩和检验(D)方差分析

18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于 C

篇三:医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计

简答

1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等

2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么? 3 假设检验的基本思想和原则

4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?

5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么?

6一型错误和二型错误的区别和联系

7什么是抽样误差?举例说明分类资料和数量资料的抽样误差 计算

1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值

(1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析)

(3)如何用白天血压估计晚上血压(回归分析)

2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)

(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分) 3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析)

2008

1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式 3. 数值资料的统计描述指标?公式?

4. 多元回归模型的基本形式?参数含义?回归效果的评价? 5. 什么叫截尾值?产生原因?举例说明

6. 一同学两样本率的比较 用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议? 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料:

小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值

(1) 对体重增加量资料进行统计描述 (2) 求饮食量和体重增加量的关系

(3) 由体重增加量的样本估计其代表总体均数的可信区间

(4) 求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5) (3)和(4)中的可信区间有什么差别?

2006

1直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?

2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路 3统计分析中P.a,B以及1-B的意义

4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路

5有一个两样本的秩和检验的应用题,写思路,不要求计算

6生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?

7给了一个实验,测量抗体.

样本序列抗体滴度效应是否有效 11:40 + 是 2 1:160 ++ 是.

. .

.就是几个表格,让你给每个列个表,并且应该用哪些指标来描述. 8正态分布,二项分布,poisson分布的可信区间

9有两个变量,让你说出分析它们相关的统计分析思路

10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.

2005(研究生)

1. 举例说明变量及变量类型。(10分)

答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。如身高、体重、疗效等

变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高(cm)、体重(kg)、心律(次/min)、血压(mmHg)等。(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。

2. 在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设。请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。(10分)

答案:P值为0.015小于检验水准a(0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等。

P值的含义是指从H0所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于)现有样本统计量的概率。若p>a,按a检验水准不拒绝H0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若p<=a,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。

3. 写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。(15分)

答案:(1)统计描述:描述资料的类型:数值变量资料频数表 资料的分布:正态性检验服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距

(2)统计推断:资料的设计类型:完全随机设计的多个样本比较

分布:正态性检验和方差齐性检验:(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。 4. 写出两变量之间相关关系的分析思路。(15分) 答案:(1)绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman等级相关分析。或者进行曲线拟合。

(2)计算直线相关系数r或者Spearman秩相关系数rs。

r?

??x?x??y?y???x?x???y?y?

2

2

?

lxylxxlyy

(3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R值也不一定等于零,应对样本相关系数做假设检验。根据检验目的,检验假设为: H0:P=0;H1=/0.常用t检验

t?

rs

r

?

r1?r

2

, v=n-2,拒绝H0认为两变量间存在直线相关。

n?2

(4)总体相关系数的可信区间估计,先对相关系数做Z变换,估计Z的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a)%可信区间(z?ua/换。

5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。要求写出随机分配方案。(10分)

随机数字表(部分数据)

编号 1-1011-20 21-30 31-40 41-50122 17 68 65 81 68 95 23 92 3587 02 22 57 51 61 09 43 95 06 58 24 82 03 47 219 36 27 59 46 13 79 93 37 5539 77 32 77 09 85 52 05 30 62 47 83 51 62 74 316 77 23 02 77 09 61 87 25 2128 06 24 25 93 16 71 13 59 78 23 05 47 47 25

478 43 76 71 61 20 44 90 32 6497 67 63 99 61 46 38 03 93 22 69 81 21 99 21 503 28 28 26 08 73 37 32 04 0569 30 16 09 05 88 69 58 28 99 35 07 44 75 47

答案:先把十五只动物按体重从小到大分别编号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15;在随机数字表任意指定某行某列,如

取第三行的1列开始,向下录入不重复的二位随机数字:16 77 23 02 09 61 87 25 21 28 06 24 93 71 13;

对应于十五只动物的编号,对随机数字有小到大编秩得出序号R如下:5 13 7 1 3 11 14 9 6 10 2 8 15 12 4;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 11 15;乙组动物为:3 8 9 10 12 ;丙组动物有:2 6 7 13 14。

6. 某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对K562细胞进行抑制。此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)?(10分)

答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。 设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。b2表示乙药物,b3表示丙药物。

先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。分析两因素之间有无交互作用及其交互作用的性质。同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。 样本含量:2X3X4=24

7. 某研究者随机测定了某地100例健康成人血清NSE酶(ug/l)含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。(20分) 答案:(1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。

统计描述: (2)通过资料来估计制定医学参考值范围:比如估计该地健康成年人血清NSE酶含量的上双侧95%(90%、99%)参考值范围,如果资料为正态分布资料,则95%医学参考值范围为(X?1.96S,X?1.96S);如果资料为对数正态分布资料,则95%医学参考值范围为lg围为(P2.5~P97.5)。

?1

n?3,z?ua

,再对Z的可信区间上下限按r=tanh z进行逆变n?3)

(Xlgx-1.96Slgx,Xlgx +1.96Slgx);如果资料为偏态分布,则95%医学参考值范

(3)统计推断:参数估计包括均数的抽样误差即标准误:Sx?

Sn

和总体均数的可信区间估计①?未知且n较

小:可信区间为(X?ta/2,?SX,X?ta/2,?SX);②?未知但n足够大:(X?ua/2,SX,X?ua/2,SX);③?已知:(X?ua/2,?X,X?ua/2,?X)。

8. 多元回归方程为:yhat=b0+b1x1+b2x2+…+bjxj+…+bpxp,其中bj的名称是什么,它的意义是什么?若比较各自变量对因变量影响的大小,应通过什么统计量比较?判断多元线性回归分析的效果应看那些指标?(10分)

答案:bj称为偏回归系数,意义是在其他自变量固定不变的条件下,自变量xi每改变一个单位时所引起的因变量y的平均改变量。

比较各自变量对因变量影响的大小,应通过bj的大小来比较。

常用的多元线形回归分析的效果指标有决定系数R(是回归平方和占总平方和的比例,值越大,回归效果越好)、复相关系数(决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度R越就接近1,线性关系越密切)、校正决定系数(越大回归效果越好)、剩余标准差(不能有m个自变量的变化解释的Y的变异,越小回归效果越好)等。

2001级七年制临床医学专业考试试题答案

1、同质:对研究指标影响较大的、可以控制得主要因素尽可能相同。 变异:同质基础上各观察单位的某变量值得差异称为变异。

2、均数的抽样误差:由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。

3、假设检验P值含义:P值是指从所规定得总体中随机抽样时,获得等于及大(负值时为等于及小于)现有样本统计量的概率。

若,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝,接受;可认为从已知总体抽到现有样本得可能性很小,该样本可能来自另一总体。

4、变量及其变量类型:

变量:在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。 变量类型:

1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位。由数值变量的测定值组成的资料称为数值变量资料或计数资料。如:身高、体重、心律、住院天数、血压等。 2.分类变量亦称定性变量,表现为互不相容的类别或属性。分类变量可分为无序与有序两类:

(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。如:性别(男、女),血型(O、A、B、AB)等。

(2)有序分类变量是指所分类别或属性之间无程序或顺序上的差别。分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料。如:尿糖化验结果按-、±、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。

二、

标准差:计算公式:s?(1) (2) (3) (4) (5)

n—1

表示观察值的变异程度

s

计算变异系数CV??100%

X

确定医学参考值范围 计算标准误

与样本含量没有关系

2

?X

?X

标准误:计算公式:s?

sn

(1) 估计均数的抽样误差的大小 (2) 估计总体均数可信区间 :

(X?t?

2

?

s,X?t?

2

?

s)

(3) 进行假设检验

(4) 与样本含量成反比

三、1、t分布,均数的区间估计: 1)?未知且n小:?X?t?

,?

sX?t?

2,?

s?

2)?未知,但n足够大时(n>100),t分布逼近u分布:?X?u?2sX?u?s? 3)?已知:?X?u?2?X?u?2??

2、二项分布:当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布,总体率?的可信区间:?p?u?sp,p?u?2sp?

3、Poisson分布:当样本阳性数X>50时,可按正态近似原理先求总体平均数?的95%或99%可信区间:

?X?u

?2

X,X?u?

X

?

四、方差分析的应用条件:

1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。

应用:1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用;3)回归方程的线性假设检验;4)多元线性回归分析中偏回归系数的假设检验等。 五、该设计是2*4析因设计

(随机数字表略去)将随机数字排秩,按秩次的1到8,分别取从A1B1、A1B2、A2B1、...、A4B2。进行实验。

六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。这就是完全随机设计两样本比较的分析思路。 其检验统计量t值是:

X?X2

, ??n1?n2?2 t?1

sX?sX2

1

七、

非条件logisti回归模型:

exp(?0??1X1??2X2????mXm)

P?

1?exp(?0??1X1??2X2????mXm)

其中?0是常数项,?1、?2??m为偏回归系数。

2002级临床医学七年制《医学统计学》期末考试题(A卷)

一、试述标准差与标准误的联系与区别。

二、请以完全随机设计资料为例说明方差分析的基本思想。

三、在某次假设检验中, ??0.05,所得的概率为P?0.001,请就本例分别说明?和P的意义?

四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些

统计信息? (10分)

表1 某社区居民2005年死亡人口调查 年龄

人口数

全死因

死亡人数 138 63 172

恶性肿瘤 死亡人数 4 12 42

0? 20? 40? 82920 46639 28161


医学统计学试卷》由:免费论文网互联网用户整理提供;
链接地址:http://www.csmayi.cn/show/155991.html
转载请保留,谢谢!
相关文章