1、数据分析中数理统计方法的正确使用重要假定v 作者所处理的数据属于随机变量的特定样本。v 作者已经掌握最基本的数理统计学常识,如概率、假设检验、均值、方差、标准差、正态分布、相关分析、回归分析、方差分析 。数理统计问题的重要性v 在科学研究中,经常会涉及到对随机变量 大小 、 离散 及 分布特征的描述以及对 2个或多个随机变量之间的 关系 描述问题。地学、环境科学研究也不例外 。v 对随机变量及随机变量之间的关系进行定量描述的数学工具就是 数理统计学 。v 在科学研究中,能否正确使用各种数理统计方法关系到所得出结论的客观性和可信性。所以, 来稿中使用的数理统计方法是否正确 应是学术期刊编辑和作者
2、极为重视的问题。v 目前,国内科技期刊对稿件中数理统计方法问题的重视程度存在差异。 1 统计软件的选择 v 统计分析通常涉及大量的数据,需要较大的计算工作量。v 在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。v 出于对 工作效率 以及对 算法的通用性、可比性的考虑,一些学术期刊要求作者采用专门的数理统计软件进行统计分析。 1 统计软件的选择问题: 作者未使用专门的数理统计软件,而采用 Excel这样的电子表格软件进行数据统计分析。v 由于电子表格软件提供的统计分析功能十分有限,只能借助它进行较为简单的统计分析,故我们不主张作者采用这样的软件进行统
3、计分析。 1 统计软件的选择v 目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有 SPSS(Statistical Package for Social Sciences)和 SAS(Statistical Analysis System)。 此外,还有 BMDP和 STATISTICA等 。v SPSS是专门为社会科学领域的研究者设计的,但此软件在自然科学领域也得到广泛应用。v BMDP是专门为生物学和医学领域研究者编制的统计软件。 1 统计软件的选择v 目前,国际学术界有一条不成文的约定:凡是用 SPSS和 SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算
4、法。由此可见, SPSS和 SAS软件已被各领域研究者普遍认可。v 我们建议作者们在进行统计分析时尽量使用这 2个专门的统计软件。目前,有关这 2个软件的使用教程在书店中可很容易地买到。 2.1 均值的计算 :理论问题v 1)均值(准确的称呼应为 “样本均值 ”)的统计学意义:反映随机变量样本的大小特征。v 2)均值对应于随机变量总体的数学期望 总体的数学期望客观上决定着样本的均值,反过来,通过计算样本的均值可以描述总体的数学期望。2.1 均值计算:理论问题(续)v 3)在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。v4)为找到代表这些观测值总体大小特征的代表值(统计量,该统计量根据样本数据算出),多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的 不一定总是正确的2.2 均值计算:技术问题v 在数理统计学中,作为描述随机变量样本的总体大小特征的统计量有算术平均值、几何平均值和中位数等多个。v 何时用算术平均值?何时用几何平均值?以及何时用中位数? 这不能由研究者根据主观意愿随意确定,而要根据随机变量的分布特征确定 。