硕士医学统计学知识点总结.doc_文客久久网wenke99.com

资源描述

1、第 2 章统计描述1. 对定量资料进行统计描述时，如何选择适宜的指标？定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值非对称分布；半定量资料；末端开口资料；分布不明众数频数最多的观察值不拘分布形式，概略分析平均水平调和均数基于倒数变换的平均值正偏峰分布资料全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距非对称分布；半定量资料；末端开口资料；分布不

2、明变异度变异系数标准差与均数的相对比不同量纲的变量间比较；量纲相同但数量级相差悬殊的变量间比较定性资料：阳性事件的概率，概率分布，强度和相对比。2. 应用相对数时应注意哪些问题?答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。3. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法图形适用

3、资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为

4、个体值，叶长为频数第 3 章概率分布1. 服从二项分布及 Poisson 分布的条件分别是什么？二项分布成立的条件：每次试验只能是互斥的两个结果之一；每次试验的条件不变；各次试验独立。Poisson 分布成立的条件：除二项分布成立的三个条件外，还要求试验次数很大，n而所关心的事件发生的概率很小。2. 二项分布、Poisson 分布分别有什么特征？二项分布、Poisson 分布都是离散型分布。二项分布的形状取决于与 n 的大小。=0.5 时，不论 n 大小，对称分布。0.5 时，图形呈偏态，随 n 增大而逐渐对称。当 n 足够大，或 1- 不太小，二项分布近似正态。Poisson 分布

5、越小，分布越偏。越大，分布越对称。当 n 足够大时，分布接近正态。4、正态分布应用估计变量值的频数分布制定参考值范围质量控制正态分布是很多统计方法的基础5. 正态分布特征以均数为中心，左右对称正态曲线在横轴上方均数处取得最高点正态分布有两个参数，即均数（位置参数）和标准差（变异度参数）正态曲线下面积有一定规律第 4 章参数估计1. 标准误与标准差的区别（1）标准差反映个体值散布的程度；标准误反映估计总体参数的精确程度。（2）标准误小于标准差。（3）样本含量越大，标准误越小，其样本均数更有可能接近于总体均数，随着样本含量的增大，标准差有可能增大，也有可能减小。（4）用途不

6、同。标准差的用途：反映一组资料的离散程度计算变异系数结合均数与正态分布的规律，估计参考值范围标准误的用途：衡量样本均数的可靠性与样本均数结合，估计总体均数的置信区间可用于进行均数的假设检验标准误与标准差的区别与联系标准差标准误区别含义描述个体观察值的离散程度反应总体参数被估计的精确程度范畴统计描述统计推断用途估计参考值范围估计置信区间n n 越大，标准差越稳定 n 越大，标准误越小联系 1.标准误大小与标准差成正比；2.n 一定时，标准差越大，标准误也越大。3. 简述置信区间与医学参考值范围的区别。区别置信区间参考值范围含义用途计算公式总体参数的波动范围，即按事

7、先给定的概率 100(1 )%所确定的包含未知总体参数的一个波动范围估计未知总体均数所在范围未知： /2,XtS已知或未知但 n30，有或/2XZ/2X个体值的波动范围，即按事先给定的范围 100(1 )%所确定的“正常人”的解剖、生理、生化指标的波动范围供判断观察个体某项指标是否“正常”时参考（辅助诊断）正态分布： /2XZS偏峰分布： PXP100X4 何谓置信区间准确度与精确度？如何协调两者间的关系。置信区间有准确度与精密度两个要素。（1）准确度由置信度 (1 ) 的大小确定，即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看，置信度愈接近于 1 愈好，（2）精密度是置信

8、区间宽度的一半，意指置信区间的两端点值离样本统计量（如、Xp）的距离。从精密度的角度看，置信区间宽度愈窄愈好。（3）在抽样误差确定的情况下，两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度，可适当增加样本含量。3、参考值范围估计的基本步骤从正常人的总体中进行随机抽样对选定的正常人进行准确的测定确定取单侧还是双侧范围确定范围常用 95%。根据资料的分布类型选用恰当的界值估计方法第 5 章假设检验1试述假设检验中与 P 的联系与区别。区别：（1）值是事先确定的一个小的概率值。为一次检验中，甘愿冒的风险。

9、（2） P 值是在成立的条件下，出现当前检验统计量以及更极端状况的概率。为0H一次检验中，实际冒的风险。联系：以 t 检验为例，P、都可以用 t 分布尾部面积大小表示。 P 时，拒绝假设。0H2. 试述假设检验与置信区间的联系与区别。联系：区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。区别：置信区间用于说明量的大小，即推断总体参数的置信范围；假设检验用于推断质的不同，即判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验？需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异，则应选用双侧检验。若需要区分何者为优，，则应选用单侧检验。在没有

10、特殊专业知识说明的情况下，一般采用双侧检验即可。4. 试述两类错误的意义及其关系。类错误：如果检验假设实际是正确的，由样本数据计算获得的检验统计量得出拒0H绝的结论，此时就犯了错误，统计学上将这种拒绝了正确的零假设（弃真）的错误0H 0H称为类错误。类错误的概率用表示。类错误：若检验假设原本不正确（正确），由样本数据计算获得的检验统计量01得出不拒绝（纳伪）的结论，此时就犯了类错误。类错误的概率用表示。0在假设检验时，应兼顾犯类错误的概率（）和犯类错误的概率（）。犯类错误的概率（）和犯类错误的概率（）成反比。如果把类错误的概率定得很小，势必增加犯类错误的概率，从而降

11、低检验效能；反之，如果把类错误的概率定得很小，势必增加犯类错误的概率，从而降低了置信度。为了同时减小和，只有通过增加样本含量，减少抽样误差大小来实现。5试述检验功效的概念和主要影响因素。答：拒绝不正确的的概率，在统计学中称为检验功效(power of test)，记为0H。检验功效的意义是：当两个总体参数间存在差异时(如备择假设：成立1 1H0时)，所使用的统计检验能够发现这种差异(拒绝零假设： )的概率，一般情况下00要求检验功效应在 0.8 以上。影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及样本量n。6简述假设检验的基本思想。假设检验是在 H0成立的前提下

12、，从样本数据中寻找证据来拒绝、接受的一种0H1“反证”方法。如果从样本数据中得到的证据不足，则只能不拒绝，暂且认为成立，0H0即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝是根据某个界值，即根据小0概率事件确定的。所谓小概率事件是指如果比检验统计量更极端（即绝对值更大）的概率较小，比如小于等于 0.05，则认为零假设的事件在某一次抽样研究中不会发生，此时有充分理由拒绝，即有足够证据推断差异具有统计学意义。0H7. 建设检验四步骤：建立检验假设 H0和备择假设 H1（判断是单侧检验还是双侧检验再作假设）确定检验水准选定检验方法和计算检验统计量确定 P 值和作出推断结论8.

13、参数及非参数检验优缺点参数检验非参数检验适用条件资料正态分布，方差齐性1.分布未知或偏态分布资料 2.总体方差不齐 3.等级资料 4.开口资料检验方法 1.t 检验 2.u 检验 3.方差分析1.符号秩和检验（配对资料）2.秩和检验 3.K-W检验（多组资料）优点：充分利用原始数据信息，检验效能高缺点：受资料总体分布限定优点：不受资料总体分布限定缺点：只利用秩次，损失原始数据，检验效能低。第6章两样本定量资料的比较1. 对于完全随机设计两样本定量资料的比较，如何选择统计方法？答：完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性（样本量较大时不必进行正态性检验）和

14、方差齐性。如果资料来自正态总体且总体方差齐，采用 t 检验；如果满足正态性但总体方差不齐，采用 t检验；当两者都不满足时，才考虑选用秩和检验。当然，我们也可采用变量变换的方法使其满足 t 或 t检验的条件。2.t 检验有几种，适用条件是什么？t 检验是以 t 分布为理论基础。小样本时，要求资料符合正态分布和方差齐性。一般有以下三种：样本均数与总体均数的比较配对资料的比较两个样本均数的比较此外，还有相关系数，回归系数的 t 检验。3.两组定量独立样本的比较（1）两独立样本的 t 检验（满足正态性和方差齐性）（2）校正的 t 检验（正态但方差不齐）（3）u 检验（大样本，且方差齐）（4）秩和

15、检验（小样本，不正不齐）p 值确定分为 T 值在范围内还是范围外4.配对定量资料的比较（1）配对资料的 t 检验（差值服从正态）（2）符号秩和检验（不正）p 值确定类似于 t 检验第 7 章多组定量资料的比较1. 方差分析的基本思想和应用条件是什么？基本思想将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的，将全部观测值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的变异可由某个因素的作用加以解释，通过比较不同变异来源的均方，借助 F 分布做出统计推断，从而推论各种研究因素对试验结果有无影响。应用条件各样本是相互独立的随机样本，均服从正态分布；各

16、样本的总体方差相等，即方差齐性。2.方差分析的步骤建立假设检验和检验水准（H 0：总体均数都相等）计算统计量 F 确定 P 值和作出推断结论作两两均数之间的比较（若 P0.05,可省略此步）3. 多组定量资料比较时，统计处理的基本流程是什么？多组定量资料比较时首先应考虑用方差分析。（1）若方差齐性，且各样本均服从正态分布，选单因素方差分析。（2）若方差不齐，或某样本不服从正态分布，选 Kruskal-Wallis 秩和检验，或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义，则需选择合适的方法（如 Bonferonni、LSD 法等）进行两两比较。4.方

17、差分析的应用？多组定量资料比较，即两个或两个以上均数的比较方差齐性检验两个或多个研究因素的交互作用回归方程的线性假设检验第 8 章定性资料的比较1. 简述检验适用的数据类型，基本思想，检验步骤。2答：卡方检验是应用较广的一种定性资料的假设检验方法，用于检验两个或多个样本率（或构成比）之间有无差别，交叉分类资料两属性间的关联性检验频数分布的拟合优度 2检验的基本思想： 2值反映的是实际频数与理论频数的吻合程度，在检验假设H0成立的情况下，实际频数与理论频数差别仅由随机误差所致，其 2值会比较小，反之亦然， 2值越大，越有理由认为检验假设 H0不成立。检验步骤：建立假设检验和检验水准（H

18、 0 ：总体分布/某情况/某率相等）计算统计量 2 确定 P 值和做出推断结论作两两之间的比较（若 P0.05,可省略此步）2.四格表资料 2检验的条件有哪些？（注意 T 为理论频数）完全随机设计公式， 2 = （ad-bc） 2. n/（a+b）（c+d）（a+c）（b+d）总例数 n40，且 T5，直接计算 2 不用校正 n40，且 1T5，用连续性校正 2检验 n40 或 T1，不能用 2检验，用直接计算概率的方法 Fisher 确切概率法。配对设计公式 2 = （b-c） 2/(b+c) b+c40，无需校正 b+c40，用连续校正公式3. 两组二分类资料的设计类型有几类？

19、其相应的检验方法是什么？两组二分类资料的设计类型主要有 2 类，即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。通用公式 2 =（A-T） 2/ T 完全随机设计公式 2 = （ad-bc） 2. n/（a+b）（c+d）（a+c）（b+d）配对设计公式 2 = （b-c） 2/(b+c) 4. 什么资料适合用秩和检验进行检验？简述秩和检验步骤。适用于总体分布未知资料，偏态分布资料，开口资料，等级资料。秩和检验步骤为：建立假设，并确定检验水准；（H 0总体分布相等/配对秩和：中体中位数为10H和 0）根据不同的设计类型对资料进行编秩并计算秩和；

20、根据计算的秩和直接查表或计算相应的统计量再查表，确定值，作出统计推断。P6、行列表资料 2检验的注意事项要求不能有 1/5 以上的格子理论频数小于 5，或不能有任意一个格子的理论频数小于 1，否则易致分析的偏性。若结果拒绝检验假设，只能认为各总体率或构成比之间总的来说有差别，并非彼此间都有差别单向有序的行列表资料，不宜作 2检验。6、两样本比较的秩和检验直接法基本思想假定含量分别为 N1 和 N2 的两个样本，来自同一总体或分布相同的两个总体，则样本含量为 N1 的样本的 T 与平均秩和 N1(N+1)/2 一般相差不大，若相差悬殊，超出界值范围，表示随机抽得现有样本统计量 T 值的概率很

21、小。7.非参与参数检验的定义及两者区别参数检验是总体的分布类型已知，对其中未知的参数进行估计和检验的统计方法。特点：依赖于特定的分布类型，比较的是参数。非参数检验是不依赖于总体分布形式的统计方法。特点：不受总体参数的影响，比较的是分布或分布位置，而不是参数。9.配对设计差值的秩和检验的编秩方法求差值将差值按绝对值大小从小到大编秩，并按差值的正负给秩次加上正负号。若差值绝对值相等，则取其平均秩次。编秩时若遇差值为 0，则舍去不计。10.两组比较的秩和检验的编秩方法将两样本混合编秩次，若有“相同数据” ，处于不同组，则取其平均秩次；在同一组，则无需取平均秩次。（数据 0 不舍去）11. 配对设计

22、差值的秩和检验的检验步骤建立假设检验，确定检验水准 H0 ：差值的总体中位数为零 H1 ：差值的总体中位数不为零计算检验统计量 T 值求差值编秩：将差值按绝对值大小从小到大编秩，并按差值的正负给秩次加上正负号。若差值绝对值相等，则取其平均秩次。编秩时若遇差值为 0，则舍去不计。求秩和确定统计量 T确定 P 值，作出统计学推断。n25，用查表法。n25，用正态近似法。8.参数检验和非参数检验的优缺点比较参数检验非参数检验适用条件资料正态分布，方差齐性1.分布未知或偏态分布资料 2.总体方差不齐 3.等级资料 4.开口资料检验方法 1.t 检验 2.u 检验 3.方差分析1.符号秩和检验（配对

23、资料）2.秩和检验 3.K-W检验（多组资料）优点：充分利用原始数据信息，检验效能高缺点：受资料总体分布限定优点：不受资料总体分布限定缺点：只利用秩次，损失原始数据，检验效能低。13.非参检验适用范围各种资料初步分析等级资料，如严重程度，优劣等级，成效大小等。资料分布类型不能确认或偏态分布。综合分析同质性较差的资料组内个别数据偏离较大，或组内相差悬殊。第9章关联性分析第10章简单线性回归分析1.Pearson 积距相关系数 r 的特点相关系数是一个无量纲的数值，且-110 为正相关，0 为负相关。| |越接近 1，说明相关性越好；| |越接近 0，说明相关性越差。2.线性回归分析的前

24、提条件 LINE线性指反应变量Y与自变量X呈线性变化趋势。一般通过散点图来考察。独立性任意两个观察值相互独立。一个个体的取值不受另外一个个体的影响。正态性指给定X值时，Y的取值服从正态分布。等方差性指对应于不同的X值，Y值的总体变异相同。Pearson 秩相关（即等级相关）的应用条件双变量不服从正态分布的资料总体分布类型未知的资料数据本身有不确定值等级资料直线回归及其回归方程有何用途描述Y对X的依存关系预测。由自变量X预测应变量Y。统计控制。通过控制自变量X的取值，从而使Y在一定范围内波动。简述做直线相关与回归分析时的注意事项回归方程要有实际意义分析前先绘散点图，观察是否存在直线趋势或

25、异常点直线回归的适用范围一般以自变量X的取值范围为限，不能随便外延。直线相关与直线回归的区别与联系区别资料要求不同。相关分析要求X，Y均服从正态分布，而回归分析时，要求Y服从正态分布。应用不同。相关是只说明两个变量间是否有关联。回归是由一个变量推算另外一个变量，说明依存变化的数量关系。相关系数与回归系数 r 与 b 不同。A.意义不同：b表示X每增（减）一个单位，Y改变b个单位；r说明具有直线关系的两个变量关系的密切程度和方向。 B.取值范围不同 -b+，-1r+1C.b有单位，r无单位。联系同一组资料相关系数和回归系数的符号相同。同一资料相关系数和回归系数的假设检验等价。即 tr=tb ,P

26、值相等。可以用回归解释相关。简述简单线性回归分析的基本步骤。绘制散点图，考察是否有线性趋势及可疑的异常点；估计回归系数；对总体回归系数或回归方程进行假设检验；列出回归方程，绘制回归直线；统计应用。回归分析中决定系数R定义：考察在 Y 的变异中，由 X 所引起的变异占多大的比重。 R 2=SS 回归/SS 总取值在 0-1 之间（因 SS 回归SS 总）大小反映了自变量对回归效果的贡献，即在 Y 的总变异中回归关系所能解释的百分比。反映了回归模型的拟合效果，常作为拟合优度的指标。当 X 与 Y 均为随机变量时，决定系数 R等于相关系数（r）的平方。第 11 章多重线性回归分析= 0 + 1X1 + 2X2 + pXp 0 ：当所有自变量为 0 时反应变量 Y 的平均取值 i ：（偏回归系数）方程中其他自变量不变时，Xi 每增加（或减少）一个计量单位，

展开阅读全文