1、 高崇山 , 山西财经大学应用数学系数理统计建模Matlab在统计中的应用 山西财经大学应用数学学院 高崇山 高崇山 , 山西财经大学应用数学系一、 概率分布及有关函数字符 分 布unif 均匀分布exp 指数分布norm 正 态 分布chi2 chi方分布t t分布f f分布bino 二 项 分布poiss poisson分布字符 功 能 调 用格式pdf 概率密度 namepdf(x,参数)cdf 分布函数inv 逆概率分布stat 均 值 与方差ran 随机数生成调用格式为:分布命令符功能命令符 (x,参数)m,v=分布 stat(x,参数 )rand产生 0,1上的随机数, randn
2、产生标准正态分布随机数。 高崇山 , 山西财经大学应用数学系y=normpdf(x,mu,sigma) 或 y=pdf(norm,x,mu,sigma)% 正态分布 N(mu,sigma2)在 x处的概率密度;y=normcdf(x,mu,sigma) 或 y=cdf(norm,x,mu,sigma)% 正态分布 N(mu,sigma2)在 x处的分布函数;y=norminv(alpha,mu,sigma) %正态分布 N(mu,sigma2)在 对应于 alfa的分位数。即 m,v=normstat(mu,sigma)%正态分布 N(mu,sigma2)的期望和方差;y=exprnd(lam
3、da,m,n)或 random(exp,lamda,m,n)%产生一个 m n的服从参数 为 lamda的指数分布的随机矩阵 高崇山 , 山西财经大学应用数学系二、 描述性统计描述性统计就是搜集、整理、加工和分析统计数据,使之系统化,以显示出数据的趋势、特征和数量关系。函数名 描 述 函数名 描 述max 求 向量或矩 阵 列的最大 值 sort 升序排列min 求向量或矩 阵 列的最小 值 sum 求向量或矩 阵 列的和mean 求向量或矩 阵 列的平均 值 cumsum 累 计 求和median 求向量或矩 阵 列的中 间值 cov 求 协 方差std 求 标 准差 corrcoef 求
4、相关系数var 求方差 kurtosis 计 算 样 本峰度rang 样 本极差 skewness 计 算 样 本偏度 高崇山 , 山西财经大学应用数学系2.1 样本均值 mean和中值 median它们都是样本数据在数据分布线上中心位置的度量 .A=1 2 4 4;3 4 6 6;5 6 8 8;5 6 8 8;mean(A) % 计算矩阵每列的均值,相当于 mean(A,1)mean(A,2) % 计算矩阵每行的均值median(A) % 计算矩阵每列的中值(中位数),相当于 median(A,1)median(A,2) % 计算矩阵每行的中值(中位数) 高崇山 , 山西财经大学应用数学系
5、2.2方差 var、 标准差 std、 极差 range和协方差 cov它们都是描述样本中的数据偏离其中心值的程度X=rand(4,5);std(X) % 计算矩阵 X每列的标准差var(X) %计算矩阵 X每列的方差range(X) %计算矩阵 X每列的极差cov(X) %计算协方差var(X)=diag(cov(X)std(X)=sqrt(diag(cov(X)X若为向量,cov(X)=var(X);若X为矩阵, X的每一列表示一个变量而行元素为观察值 。对于二维随机向量 (X,Y), x为 X的观察值, y为 Y的观察值 (x,y为同维向量 ), 则有:cov(x,y)=cov(x,y)
6、 高崇山 , 山西财经大学应用数学系2.3 百分位数及其图形描述百分位数 (percentile)是把数据按从小到大的顺序排列后,位于 p%位置的值称为第 p百分位数。第 25百分位数由叫做四分之一分位数 (下四分位数 ), 75百分位数由叫做四分之三分位数 (上四分位数 ), 第 50百分位数就是median中数。最小值是第 0百分位数,最大值是第 100百分位数。百分位数是用于反映样本数据形态信息的数据统计量,它也可以刻划数据的位置和散布特征。Y = prctile(X,p) 返回样本 X中大于 p%(00时,表示数据在均值右边的比左边的多; f 0正好相反; f 接近于 0,则表示分布是对称的。峰度描述的是分布曲线的陡缓程度,定义为:它是以正态分布为标准,比较两侧极端数据分布的情况的指标。 g较大,则表示样本中有许多远离均值的数据。上述公式中, s是样本标准差。f=skewness(X)g=kurtosis(X)