1、基于 Excel 进行科研设计资料均数 t 检验【摘要】 目的 探索利用 Excel 统计函数进行 t 检验。方法 将计数资料的 t 检验分为有原始数据和没有原始数据的 t 检验,分别建立格式化的电子表格,利用 Excel 统计函数 TEST、TINV、FTEST 进行 t 检验运算。结果 利用 Excel 统计函数可快速计算出 t 检验值和 t0.05 值,无需再查 t 分布的双侧分位数表。结论 t 检验值计算结果可靠,简单易学。 【关键词】 Excel;统计函数;t 检验在医药科研论文中,常用到 t 检验,其目的在于帮助决策者基于小样本事件对总体作出二择一决策1,2 。在没有 SAS 和
2、SPSS 等统计分析软件包时,单凭手工计算,费时费力,结果还不一定可靠。现在利用 Excel 统计函数功就可以方便实现 t 检验。此法具有简单易学、结果可靠、成本低廉、易于推广的优点。1 资料与方法1.1 工作平台 主频 200 MHz 以上 CPU ,64 M 内存, 1.2 G 以上硬盘。Window 98/2000/XP 操作系统,Excel 2000 或以上版本。1.2 随机化配对设计资料均数的 t 检验1.2.1 资料 例 1:12 个志愿者服用某减肥药,服药前后体重数据见图 1,判断此减肥药是否有效。1.2.2 方法 单击 C3 单元格,点击“插入”菜单下的“fx 函数” ,打开黏
3、贴函数对话框,在“函数分类”项下选“统计” ,在“函数名”项下选“TTEST”,单击“确定” 。打开 TTEST 对话框,在 Array1 栏输入“B1:M1”,在 Array2 栏输入“B2:M2” ,Tails 栏输入“2” ,Type 栏输入“1” ,按“确定” ,在 C3 单元格显示概率 P 值为“0.57” (保留小数后两位) ,此时就可以得出此减肥药效果为零的结论;用 P 值可反过来求 t值,单击 E3 单元格,其余同前,只在“函数名”项下选“TINV” ,在Probability 栏中输入“C3” ,在 Deg_freedom 栏中输入自由度“11” ,在F3 单元格显示 t 为
4、“0.58” (保留小数后两位) 。利用 TINV 函数,求出在显著性水平 0.05,自由度为 11 时临界值t0.052.20,tt0.05,这与 P=0.570.05 结果一致,结论与教材上一致1 。1.2.3 数据分析 选择菜单“工具”项下的“数据分析” ,选择“t 检验:平均值成对二样本分析” ,按确定,变量 1 的区域输入“$B$1:$M$1” ,变量 2 的区域输入“$B$2:$M$2” , 0.05,输出选项,可以不选,直接按确定,输出如图 1。1.3 两组完全随机化设计资料均数的 t 检验1.3.1 资料 例 2:某克山病区测定 11 名克山病患者与 13 名健康人的白磷值(m
5、mol/L)如图 2,检验患者与健康者白磷均值是否不同。1.3.2 方法1.3.2.1 F 检验 两组完全随机化设计资料均数的 t 检验,要根据两组方差是否齐性而采取不同的 Type 值,方差齐性选 Type2,方差不齐性选 Type3,故要先进行方差齐性的 F 检验。方法:基本操作同前,只在“函数名”项下选“FTEST” ,单击“确定” 。打开 FTEST 对话框,在 Array1 栏输入“B1:L1”,在 Array2 栏输入“B2:N2” ,按“确定” ,在 B3 单元格显示概率 P 值。P0.05,因此方差齐性;若 P0.05,则方差不齐。1.3.2.2 t 检单击 D3 单元格,打开
6、 TTEST 对话框,在 Array1 栏输入“B1:L1”,在 Array2 栏输入“B2:N2” ,Tails 栏输入“2” ,Type 栏输入“2” ,按“确定” ,在 D3 单元格显示概率 P 值。用 P 值可反过来求 t值,单击 F3 单元格,打开 TINV 对话框,在 Probability 栏中输入“D3” ,在 Deg_freedom 栏中输入自由度“22” ,在 F3 单元格显示 t。利用 TINV函数,求出在显著性水平 0.05,自由度为 22 时临界值t0.052.07,tt0.05,这与 P0.05 结果一致,也与教材结果一致2 。1.4 科研论文中的 t 检验初步验证
7、 在科研论文中常常碰到 t 检验问题,需要进行验证。如果文献提供了均数、标准差和分组情况,虽然没有原始数据,也可按如下方法进行简单验证。1.4.1 两组完全随机化设计资料均数的 t 检验例 3:男女红细胞计数(1012/L)样本均数、样本标准差和样本量分别对应于图 3 中实验组和对照组,试判断男女红细胞计数的总体均数是否相等。此法适用于方差齐性。在 B4 中输入“=(C2C3)/SQRT(B21)*D2*D2+ (B31)*D3*D3)/(B2+B32)*(1/B2+1/B3)” 求 t,在 B5 中输入“=TINV(0.05,B2+B32)” 求 t0.05。利用 t 值求 P 值,在 D4
8、 中输入“=TDIST(B4,B2+B32,2)” 求 P。结论:由于 tt0.05,故认为两组均数不等,这与 P 值一致。例 4:随机抽取 10 名病人和 20 名健康人,分别测定某生化指标,其样本量、样本均数和样本标准差分别见图 4 中实验组和对照组,试判断总体均数是否相等。按图 4 在 B11 中输入“=(C9C10)/SQRT(D9*D9/B9+D10*D10/B10)”求 t,在 B12 中输入“=(D9*D9*TINV(0.05,B91)/B9+D10*D10*TINV(0.05,B101)/B10)/(D9*D9/B9+D10*D10/B10)” 求校正后的 t0.05,在 D1
9、1 中输入“=TDIST(B11,B9+B102,2)” ,求 P 值。由于方差不齐,故出现了 P 与 t 值矛盾的结论,此时由于对 t0.05 进行了校正,故应按 t 值进行判断。结论:认为两组均数相等,无显著性差异。1.4.2 单组完全随机化设计资料均数的 t 检验 例 5:大量调查表明健康成年男子脉搏的均数为 72 次/min,某医生在一山区抽样调查了 25 名健康成年男子,其脉搏均数和标准差见图 5 中实验组,能否判断山区健康成年男子脉搏与常人有差异。按图 5,在 B20中输入“=(C18C19)/(D18/SQRT(B18)” 求 t 值,在 B21 中输入“=TINV(0.05,B
10、181)” 求 t0.05。在 D20 中输入“=TDIST(B20,B181,2)” 求 P。结论:认为两组均数不等,有显著性差异。1.4.3 随机化配对设计资料均数的 t 检验 若实验数据为配对资料(如例 1) ,可求配对处理前与处理后差值的均数及标准差。如例 1,其样本量、差值均数和差值标准差分别为12、1.33、7.91,按图 5 录入实验组,但此时对照组均数为“0” ,按 2.3.2项下操作,可一步得到结果。2 讨 论在 t 检验统计对话框中涉及以下参数:Array1 和 Array2 分别代表第一组数据和第二组数据,Tails 代表分布尾,单尾取 1,代表单侧检验,双尾取 2,代表
11、双侧检验。同一批数据作单侧检验,其 P 值减半,倾向于拒绝 H0,会增加犯第类错误的机会,因此应少作单侧检验。只有根据专业知识和常识有充分理由排除某一侧,即认为某一侧是不可能发生的事情,才进行单侧检验。Type 代表 t 检验的类型,1 代表配对检验,2 代表双样本等方差假设,3 代表双样本异方差假设。Probability 代表概率,Deg_freedom 代表自由度。如为单组前后对照,则自由度为参与者减 1;如为双样本对照,则为参与者减 2。在无原始数据时 t 检验验证中,可根据方差数值差异初步判断方差类型。Excel 具有强大的统计处理功能,利用以上操作可以得出简单的二择一结论。在建立了
12、多种形式的 t 检验表后,如图 3图 5,需要对工作表进行保护3 ,除了数据录入区域外,使其他区域处于保护状态,将电子表以模板形式保存,日后只需要修改录入区数据,既可一步得到检验结果。当然,要想一次得到更为详细的结论,如平均值、方差、单尾临界值、双尾临界值等,要选择菜单“工具”项下的“数据分析” ,如“工具”项下无“数据分析” ,则要选择加载宏,在对话框中指定加载分析工具库。若结合 VBA 编辑器进行简单编程,可得到个性化的专业统计软件。【参考文献】1 徐秉玖.药物统计学M.北京:北京医科大学出版社,1999:228.2 方积乾.医学统计学与电脑实验M.上海:上海科技技术出版社,1997:86.3 袁 进,赵树进.Excel 软件统计函数在医药资料设计 2 检验中的应用J.中国药房,2006;17(20):1595.