医学统计学研.ppt

上传人:h**** 文档编号:187252 上传时间:2018-07-15 格式:PPT 页数:39 大小:968KB
下载 相关 举报
医学统计学研.ppt_第1页
第1页 / 共39页
医学统计学研.ppt_第2页
第2页 / 共39页
医学统计学研.ppt_第3页
第3页 / 共39页
医学统计学研.ppt_第4页
第4页 / 共39页
医学统计学研.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、医学统计学,卫生统计学教研室 田考聪,绪论,一、医学统计学的定义1.引言:Statistics,政治算术,必然现象 随机现象,概率论 数理统计,各应用统计学:生物统计学、经济统计学,state:国家(征兵 税收),赌博,2.定义:医学统计学是运用概率论与数理统计的原理和方法,收集、整理、分析医学中反映随机现象的数字资料,并推断其客观规律的一门学科。,这个定义指出了医学统计学的:,1)研究对象:医学中的随机现象(数字资 料),2)研究步骤:收集、整理、分析、推断,3)研究方法:概率论与数理统计的基本原理 和方法,4)研究目的:从随机现象中找出统计规律,3.医学统计学的用途 生物医学实验 临床试验

2、 流行病学调查 公共卫生管理 医学科研项目申请 新药开发和报批 医学杂志发表研究论文,二、医学统计学的基本内容1.研究设计 定义:目的 安排 要求 (可行、高效、低误、 经济) 要素:对象 处理 效应 原则:对照 随机 可重复 方案:成组 自身 配伍 析因 正交,2.数据处理1)统计描述:用某些特征值或统计图表来描述统计资料的特征。2)统计推断:运用统计方法对统计资料进行分析、研究、推断其统计规律性。,三、基本概念1.随机试验:满足下列条件的试验称为随机试验: 1)在相同条件下可以重复进行的试验; 2)可能出现的试验结果不止一个; 3)试验前不能预知本次试验会出现哪一个结果。,为事件A在n次试

3、验中出现的频率。0f (A) 1,2.随机事件: 1)基本事件:随机试验所得的结果。 2)随机事件:由基本事件及其复合而成的事件。,3.频率:若在n次试验中,事件A出现了m次,则称,4.概率:反映随机事件A发生的可能性大小的量,通常记为P(A)。它是随机事件本身所固有的一种本质属性。,5.随机变量:为方便计,定义一个变量X,按试验的不同结果取不同的值。这个变量X称为随机变量。 注:由于事件的发生具有一定的概率,故随机变量X的取值也有一定的概率。,6.统计资料的类型:(两大类) 定量资料(计量资料): 测定观察单位某项指标所获得的统计资料。其特征是:每个观察单位对应一个具体的测量值。,定性资料:

4、 计数资料:将观察单位的某项指标的观测结果按性质或类别的不同,分两类计数而得的统计资料。,等级资料:将观察单位的某项指标的观测结果按性质的不同程度,分等级计数而得的统计资料。其特征是:各等级之间存在“递进关系”。,分类资料:将观察单位的某项指标的观测结果按类别分多类计数而得的统计资料。其特征是各类别间并不存在“递进关系”。统计资料的转换:为了研究需要或数据分析方便,有时需要对统计资料进行转换,一般是将计量资料转换为计数或等级资料。,7.总体与样本 个体:各观察单位的某项指标的测定值。 总体:根据研究目的所确定的、具有某种相同性 质的所有个体的集合。,样本:同一总体中一部分有代表性的个体所构成

5、的集合。,样本必须具备的三个条件是: 同一性:保证被研究对象的同质基础,包括时 间、空间、条件等; 随机性:总体中每一个体都以同样的概率被抽 到样本中去; 可重复性:保证样本中有足够的个体数,即样 本含量足够大。,医学研究的统计学设计,一、医学研究的基本步骤二、医学研究的类型三、实验设计,一、医学研究的基本步骤1. 查阅文献,做出综述,进行评价;2. 建立科学假说,提出拟探索和解决的医学问题,明确具体 的研究目标;3. 拟定研究设计方案和技术路线;4. 实施研究计划;5. 收集、整理分析研究所得的信息和资料;6. 对研究结果进行解释,对提出的假说进行评价。 专业设计重要性、科学性、创新性、可行

6、性 统计设计可靠性、有效性、合理性,二、医学研究的类型 根据研究者是否主动安排处理因素,对观察对象施加干预,医学研究分为实验研究与调查研究两大类。实验研究: 对研究对象人为施加干预,控制实验条件,比较不同干预措施间的效果。调查研究: 对研究对象不加任何干预措施,被动地进行观察,比较不同条件下研究对象之间的差异。,三、实验设计,(一)实验设计的基本内容 一个完整的实验设计方案,从统计学的角度来讲,应该包含以下主要内容:1. 研究目的 2. 研究方法 时间 现状、回顾、前瞻 对象 临床实验、动物实验3. 三要素: 研究对象、处理因素、研究效应4. 三原则 : 对照、随机、重复5. 研究的整体程序和

7、方案(包括实验方案、数据分析方案) 技术路线 关键问题解决方法 质控措施,(二)实验设计的三要素1. 研究对象:根据研究目的所确定的同质的实验观察个体。 同质(纳入标准、排除标准) 总体、样本2. 处理因素:根据研究目的对研究对象给予的某种干预或措施。(可以是研究者主动施加的或客观存在的) 处理因素的标准化问题:在整个研究过程中,处理因素必须相对固定,统一标准。 非处理因素的控制:在实验过程中,应注意控制非处理因素的干扰,避免混杂效应。,3. 实验效应:处理因素作用于研究对象的反应或结果,通常以指标(变量)的形式来表达。所选指标应具备: 客观性、精确性、敏感性、特异性 客观性:主观指标和客观指

8、标。 精确性: 准确度:观察值与真值的接近程度,受系统误差的影响。 精密度:重复观察时,观察值与其均值的接近程度,受随 机误差的影响。 敏感性和特异性:,实验设计三要素,(三)实验设计的三原则1. 对照原则: 在确定接受处理因素的实验组时,要同时设立不施加处理因素的对照组。通过对照消除非处理因素对实验结果的影响。 设置对照时应满足均衡原则,即对照组与实验组除处理因素不同外,其余影响实验效应的非处理因素应尽量均衡一致。 设置对照还应满足同步原则,即对照组与实验组在整个实验过程中始终处于同一空间,同一时间。,常用对照形式:安慰剂对照(placebo control):对照组给安慰剂 特点:克服心理

9、导致的偏倚;消除疾病自然进程的影响。空白对照(blank control):对照组不给予任何处理因素。 特点:简单易行,易引起心理差异,从而影响实验效应的 测定。实验对照(experimental control):对照组施加基础实验条件(非处理因素)。如:在赖氨酸添加实验中,儿童课间餐方式为: 实验组 赖氨酸面包 对照组 面包,自身对照:实验在同一受试对象上进行。 特点:简单易行,使用广泛。 若试验前后某些环境或自身因素发生改变,会影响 试验结果,难以说明问题。标准对照(standard control):以现有的标准或正常值作对照。 某种新的方法能否代替传统方法的研究。,2. 随机化原则:

10、指每个受试对象以均等机会被抽取、被随机地分配到试验组和对照组。即每个受试对象接受处理的机会均等。 目的是使各组非实验因素的条件均衡一致,以消除对实验结果的影响。随机化分组:将实验对象按相同的概率分配至预先设定的几 个处理组中去。 随机化分组的方法有很多,我们介绍二种常用的方法: 完全随机设计、随机区组设计。,例1.完全随机设计:试将12头动物应用随机数字表分配到甲、乙两组。 将动物编号:1,2 , ,12。 从附表1的第11行,第11列往右查12个2位数的随机数。 规定按随机数大小分组,较小的6个数对应的动物为甲组,较大的6个数对应的动物为乙组。,完全随机设计虽然提高了各组的均衡性,但不能保证

11、各组的均衡性。例如在例1中,如果12只动物中雌雄性各有6只,而实验效应可能受动物性别不同的影响,按照完全随机设计的方法显然不能保证甲乙两组中同性别的动物数相等。为了解决这个问题,我们可用随机区组的方法来进行分组。随机区组设计:先将可能影响实验结果的非处理因素进行分层,即区组化(blocking),然后在每一层内进行随机化分组。,例2. 随机区组设计: 如果体重是影响实验效应的非处理因素,需要将16头动物分为4组,怎样分组才能保证均衡性? (1)将16头动物称重后,按体重由小到大依次为1,2, ,16号. (2)把体重相近的4头动物作为一个区组,即等分成4个区组. (3)对于每一个区组,从随机数

12、字表中任意一行一列作起点顺序取4个随机数字,取两位随机数字,对应于该区组的4个动物,然后将随机数字由小到大顺序排列后得序号,再按序号的大小依次排列组别。,随机区组设计,练习:将例1中的12只动物随机分为甲乙两组,使甲乙两组中同性别的动物数相等。,3. 重复原则:在相同条件下进行多次研究或观察,以保证实验的可靠性与科学性。即要求研究对象要有足够多的数量(样本量)。,统计描述,一、频数分布1.频数分布表:为了解数据的分布范围、集中位置、分布形态等特征,需要编制频数表。,例1:某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表。,81例30-49岁健

13、康男子血清中的总胆固醇值(mg/dL)测定结果,步骤:,1).求全距 R=max-xin= 278.8-97.5=181.3,2).定组数 K 通常取815组为宜。本例取K10.,3).求组距 IR/K (注意取整)。 本例I181.3/10=18.1320,4).制表 确定各组段的下限、统计各组段内的频数、 算出各组段的频率、累计频数、累计频率, 将所得数据填入表中。,81例健康男子血清总胆固醇值(mg/dl)的频数分布表,2.频数分布表的作用1)描述数据分布特征;2)计算有关指标;3)发现奇异值。,二、计量资料的统计描述1.集中趋势:反映集中趋势和集中位置的指标,亦称平均数。1)算术均数

14、适用于分布比较对称的资料。 定义式:,加权式:,例2.3,例:由例1的数据:,2)几何均数 适用于变量值呈倍数关系的资料。,例2.5 例2.6,3)中位数: 将n个数据按大小顺序排列,位置居中的那个数称为中位数.,中位数有以下特点:1.对离群值不敏感.故当有离群值或数据分布不对称时,可 采用中位数来描述集中趋势.2.当数据分布对称时,均数和中位数很接近, 当数据呈右偏态时,均数大于中位数; 当数据呈左偏态时,均数小于中位数.,例2.7,2.离散趋势:反映数据分布的离散程度 例2.10,常用的分位数有四分位数、百分位数等。,四分位数,下四分位数Q1,上四分位数Q3,中位数Q2M,百分位数,1)全

15、距 RMAXMIN,2)分位数与分位数间距 分位数是介于最大值与最小值之间的一个数值,它使得一部分观察值小于或等于它,另一部分观察值大于或等于它。两个分位数之间的距离称为分位数间距,可用来描述数据的离散程度。,百分位数的计算公式如下:,式中:L是所在组段的下限,i是该组段的组距,fp是该组段的频数, n 是总频数, fL是该组段以前的累计频数。,显然,中位数即为50%位数,下四分位数即为25%位数,上四分位数即为75%位数。,例2.8,3.方差,4.标准差,5.变异系数,例2.13,例2.15,几个离散指标的比较: 全距简单易求,但所用的信息较少,对离群值较敏感,与样本含量n有关, n越大,全距可能越大。,分位数间距简单易求,对离群值的敏感度小于全距,受样本含量影响较小。但使用的信息量仍然较少。,方差使用了全部信息量,特别是利用了数据集中位置的信息,优于全距和分位数间距。但方差作了一个平方处理,夸大了各数据点与集中位置的离散程度。,标准差是方差的平方根,它将方差夸大了的离散程度 作了还原,且具有方差的全部优点,因此标准差在实际应用中最为常用。,变异系数用来度量相对变异程度,是一个无量纲的指标,可以用来比较不同量纲变量之间的变异程度,也可以用来比较量纲相同但均数相差较大的变量之间的变异程度。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。