精选优质文档-倾情为你奉上基于R语言的描述性统计分析方法对于数据的基本特征,要分析数据的集中位置,分散程度,数据分布。1.1位置的度量位置的度量指的是用来描述定量资料的集中趋势的统计量,常用的有均值、众数,中位数,百分位数等。(1)均值均值(mean)是数据的平均是,其定义为,用于描述数据的平均位置。(2)中位数中位数(median)定义为数据排序位于中间位置的值,即中位数用于描述数据中心位置的数字特征。对于对称分布的数据,均值和中位数比较接近;对于偏态分布的数据,均值与中位数不同。中位数的又一显著特点是不受异常值的影响,具有稳健性。(3)百分位数百分位数(percentile)是中位数的推广,将数据从小到大的排序后,对于,则它的分位数定义为:,其中表示的整数部分。1.2 分散程度的度量表示数据分散程度的特征量有方差、标准差、极差、四分位极差、变异系数和标准误差。(1)方差、标准差、变异系数方差是描述数值取值分散性的一个度量,样本方差是相对于均值的偏差平方和的平均,记为,即,其中是样本的均值