1、 本科毕业论文 ( 20 届) 马尔柯夫链在班级成绩预测中的应用 所在学院 专业班级 数学与应用数学 学生姓名 学号 指导教师 职称 完成日期 年 月 I 摘要 马尔柯夫链是状态离散、时间为非负整数、无后效性的随 机过程 , 很多社会现象和自然现象都符合该随机过程 , 因此被 广泛 的 应用 生产实践当中 . 本文首先从马氏链的基本理论入手 , 介绍马尔柯夫链的思想起源 , 主要应用方向及研究成果 , 接着讨论了马尔 柯 夫链转移概率计算方法 , 其次 建立了马氏链应用到 教育 领域的 预测 模型 , 并且对该模型进行实际应用 , 预测某小学一班级未来三年的综合成绩 , 取得了较好的效果 ,
2、为教师教育工作提供数据参考 . 关键词 : 马尔 柯 夫链 ; 转移概率 ; 成绩预测 II Markov Chain Prediction for The Application of Academic Classes Abstract Markov chain is a stochastic process, in which the state is discrete, the time nonnegative integer and no aftereffect, a lot of social phenomenon and natural phenomenon all conform
3、 to the stochastic process. It is widely used in the social production practice. In this paper, firstly, we introduce the basic theory of Markov chain, the thought origin of Markov chain and the main application direction and research. Secondly we discuss the probability calculation method of Markov
4、 chain transfer. Thirdly , we build the mode of Markov chain in education field, and do some application about the model to forecast some phenomenon in the field of education for teachers education work, provide data reference. Keyword: Markov chain; Transition probability; Education Prediction III
5、目 录 摘要 . Abstract . 1 前言 . 1 1.1 马尔柯夫链简介 . 1 1.2 马尔柯夫链研究成果 . 1 1.3 马尔柯夫链在教育领域的应用背景 . 2 2 马尔柯夫链理论概述 . 3 2.1 马尔柯夫链的定义 . 3 2.2 马尔柯夫链状态分类 . 4 2.3 离散时间的马尔柯夫链 . 5 2.4 连续时间的马尔柯夫链 . 5 3 马尔柯夫链关于成绩预测的模型及应用 . 7 3.1 马尔柯夫链关于成绩预测的模型 . 7 3.2 马尔柯夫链预测模型的应用 . 9 4 小结 . 12 参考文献 . 13 致谢 . 14 1 1 前言 1.1 马尔柯夫链简介 马尔 柯 夫是享誉
6、世界的著名数学家 . 他在概率论、数理统计、数论、函数逼近论、微分方程、数的集合等领域都有建树 . 在 19061912 年间 , 马尔 柯 夫提出并研究了一种能用数学方法研究自然过程的一般图示 , 人们把这种图示用他的姓氏命名为马尔 柯 夫链 (Markov Chain). 同时 他第一次提出了对一种无后效性的随机过程的研究 , 即在已知当前状态的情况下 , 未来状态与其过去状态无关的过程 , 这就是现在众所周知的马尔 柯 夫过程 (Markov Process). 所谓马尔柯夫链就是在“现在”的条件下 , “过去”与“将来”都是相互独立的 , 即如果某一时刻系统状态的概率分布与前一时刻的状
7、态有关,与以前的状态无关,则该系统符合马尔柯夫性或者无后效性 , 具有马尔柯夫性的随机过程称为马尔柯夫过程对于时间和状态都是离散的的马尔柯夫过程称为马尔科夫链 1 . 马尔 柯 夫理论极大的丰富了概率论的内容 , 它是研究自然科学和技术最有效的数学方法之一 . 马尔柯夫预测是马尔科夫链在预测领域的一种应用 , 它是描述一类随机动态系统的模型 , 是指系统在每一个时间所处的状态是随机的 , 从当前时间到下一时间的状态按一定的概率转移 , 但未来状态仅与现在状态及其转移概率有关 , 与以前状态无关 , 即无后效性 . 马尔柯夫过程的研究在概率论中一直占有核心地位 , 经过近百年的发展已形成完整的理
8、论体系 . 由于自然界和人类社会中的许多现象都具有无后效性,所以马尔柯夫过 程广泛应用于 医学、教育管理、公共卫生、近代物理、生物学、公共事业、地质学、水资源科学、大气科学 等众多科学领域 . 马尔柯夫方法的主要研究对象是一个运行系统的状态和状态的转移 2 . 即 根据某些变量的现在状态及其变化趋向 , 来预测它在未来某一特定期间可能出现的状态 , 从而提供某种决策的依据 . 马尔柯夫决策过程 3 , 简称马氏决策 . 由马尔柯夫链的描 述可知它的过程有如下三个特点 : 过程的随机性、过程的离散性和过程的马尔柯夫性 . 1.2 马尔柯夫链研究成果 马尔柯夫链预测方法在各个领域中的应用一直是国内
9、外学者研究的重点和热点 , 研究成果也相对比较多 , 理论也相对比较成熟 , 主要体现在 : (1) 人力资源流动时间序列都符合马氏性 . 可按转移概率 , 根据当前的状态预测以后的状态预测以后的状态 , 从而采取相应的策略 . (2) 马尔柯夫链在宏观经济形式的变化、企业市场占有率及期望利润的变化过程都具有2 随机性和无后效性 , 都符合马尔柯夫链 的的应用要求 . 在对它们进行预测时 , 马尔柯夫链预测方法不需要连续不断的历史数据 , 只需要近期的资料就可以采用马尔柯夫链来描述 . 这就是运用马尔柯夫链的方法进行预测市场的占有率和期望利润分析的基本思想 .4 . ( 3)在很多灾变的过程中
10、,马尔柯夫链都已一定的参考性,比如 应用马尔柯夫链方法测报草原蝗虫 . 蝗虫是渐变态 , 即若虫和成虫栖息于同一生境 , 并取食相同的食物即草原牧草 . 了解蝗虫的出土期、系统地掌握蝗虫的个体发育以及 种群数量动态变化 , 对草原畜牧业生产具有非常大的参考作用 56, . ( 4)利用马氏链模型预测宁南旱情 . 宁南山区干旱频繁 , 严重影响农业生产 . 根据固原气象站降雨量资料 , 应用马尔柯夫链模型预测该地区年降雨量与旱情趋势 , 对该区农业生产有参考价值 7 . ( 5)市场占有率及期望利润的马尔柯夫链预测 . 运用马尔柯夫链理论对商品销售的市场占有率预测 和期望利润预测进行了研究 ,
11、取得了一定的效果 8 . 马尔柯夫链在其它领域的应用还有很多 , 比如 马氏链在房地产市场营销 , 机车管理预测 , 大白菜年景预测 , 贵重器材需求预测 , 国际工程投标风险预测 , 中国各地区人均 GDP的马尔科夫预测及变动分析中得到了很好的应用 . 1.3 马尔柯夫链在教育领域应用背景 在 教育 领域进行预测和决策从整体上看有一定的规律 , 班级成绩 预测和 课程 研究的任务 , 就在于认识 班级 活动中 的 各种规 律 . 班级成绩变化 现象是个随时间 变化 的过程 , 可以视为已相依的随机变量序列 , 其前后影响因素是错综复杂的 , 并且符合马氏链的三大特点即过程的随机性 , 过程的
12、马尔科夫性 , 过程的离散性 , 可视为随机马尔科夫过程 . 在检测其具有一定的马氏性后 , 然后根据一个指标把系统划分为多个变化区间 , 可以建立马尔 柯 夫链模型来做预测分析 . 最重要的是根据实际观测资料对某些刻画系统的关键定量指标进行系统分析 , 标准的预测未来 . 本文拟利用马尔柯夫链在教育领域 j建立班级成绩预测模型 , 希望能给教师教育工作带来一定的帮助 . 3 2 马尔柯夫链理论概述 2.1 马尔柯夫链定义 马尔柯夫链是状态离散、时间为非负整数、无后效性的随机过程 . 无后效性是指当过程的现在状态为已知时 , 未来状态与过去状态无关 , 而只与当前的状态有关 . 无后效性的数学
13、表述为:即在某一时刻状态条件下的条件概率与所取的值无关而仅与 )( nt 所取的值有关 . 若从 n 时刻处于状态 i 转移到 1n 时刻处于状态 j 的一步转移概率 )( npij 与转移的起始时间 n 无关 , 而只与 ji, 有关 , 则称其为齐次马尔柯夫链 2 . 当随机过程在 kt 时刻所处的状态已知时 , 在时刻 ktt 所处的状态近于 kt 时的状态有关 , 而与 kt 以前的状态无关 , 这种随机过程为马尔柯夫过程 . 用分布函数来描述 : 若在条件 ),2,1( niYtY ii )( ( 2.1.1) 下的 nY 的分布函数恰好等于条件 )1(1 nYtY n )( 下的分
14、布函数 , 即 )()( 11221121 ;,;,; nnnnnnnnnn tYtYFtttYYYtYF ( 2.1.2) 则称 ()Yt为马尔柯夫过程 . 定义 2.1.1 设马尔柯夫链在 kt 时取状态 1, nI ,I 的概率分别为 nPPP , 21 , 而),2,1(10 niPi , , 向量 nPPP , 21 称为 kt 时的状态概率向量 . 定义 2.1.2 设系统可能出现 N 个状态 nII ,1 , 则系统由 kt 时刻从 iI 转移到状态 1kt 时刻 jI 的概率就称为从 i 到 j 的转移概率 , 也称一步转移概率 , 记为 : )( jiij IIPP . (
15、2.1.3) 状态转移矩阵在一定条件下 , 系统只能在可能出现的状态 nII ,1 中转移 , 系统所有状态之间转移的可能性用 P 表示 , 定义 P 为状态转移概矩阵 : 11 1 1 222 1 2 212nnn n n nPPPPPPPP P P. 概率矩阵 : 4 njijijPP1110 ni nji ,2,1 ,2,1, . ( 2.1.4) 一般的 , 将满足( 2.1.4)的任意矩阵都叫做随机矩阵或者概率矩阵 . 一般来说 , 转移概率 ijP 不 仅仅 与状态 ,ij有 关 , 而且还与时刻 n 有 关 . 当 ijP 不依赖于时刻 n 时 , 则 表示马尔可夫链具有平稳转移
16、概率 . 如果 对 任意的 ,i j I , 马尔可夫链 , nX n T 的转移概率 都 与 n 无关 , 则称马尔可夫链是齐次的 , 在本文 主要研究齐次马尔可夫链 . 齐次马尔可夫转移概率 nijP 有如下性质 : (1) lnklIk liknij PPP ; (2) jkkkIk ikIknij nnPPPP 1211 11 . 2.2 马尔柯夫链的状态分类 假设 0, nXn 是齐次马尔可夫链,其状态空间 ,2,1I , 一步转移概率是 iip , 我们用概率性质对状态进行分类 . 定义 2.2.1 设 I 是马氏链 nX 的状态空间 , 则有 : ( a) 如果 iip =1,
17、则称 i 是吸引状态 ; ( b) 如果存在 1n 使 0niip , 则 i 通 j , 记为 ji ; ( c) 如果 ji 并且 ij , 则 ji, 互通 , 记为 ji . 互通关系具有以下几个性质: ( a)反身性 : ii ; ( b)对称性 : 若 ji , 则 ij ; ( c)传递性 : 若 kjji , , 则 ki . 为了定义常返和非常返状态 , 对马氏链 nX , 需要引进条件概率 iXjXPfij 011 |, iXnkjXjXPf knnij 0|11;, 1n . 5 nijf 是以质点从 i 出发当作条件 , 第 n 步首次到达 j 的概率 , 称为首达概率
18、 . 2.3 离散时间 马尔柯夫链 定义 2.3.12 如果对任何正整数 n 和 I 中的 110 , niiiji , 随机序列 nX 满足 .,),|()|(),|01100111IjiiXjXPiXjXPiXiXiXjXPnnnnnn ( (2.3.1) 则称 nX 为时齐的马尔柯夫链 , 简称马氏链 . 这时称 IjiiXjXPpij ,),|( 01 (2.3.2) 为马氏链 nX 的转移概率 , 称矩阵 IjippP ijij ,),()( (2.3.3) 为马氏链 nX 一步转移概率矩阵 , 简称概率矩阵 . 由于 )(1 IjjX 是完备事件组 , 所以得到 1)|()|(01
19、01 iXjXPiXjXPp IjIjIj ij . (2.3.4) 于是转移矩阵 P 的各行之和等于 1, 该矩阵称为随机矩阵 . 对马氏链的直观理解是 : 已知现在 iXB n , 将来 jXA n 1 与过去 0011 , iXiXC nn 独立 . 我们把这种性质称为马氏性 1 . 2.4 连续时间 马尔柯夫链 定义 2.4.12 设 nX 是上一小节中的马氏链 , 有状态空间 I , 一步转移概率 ,| 01 IjiiXjXPpij )( ( 2.4.1) 满足 Iipii ,0 . 该马氏链 nX 的时间指标 ,2,1,0n 是离散的时间马氏链 . 定义 2.4.22 设 I 是状
20、态空间 , 0|)( ttXtX )( 是以 I 为状态空间的连续时间随机过程 . 如果对任何正整数 n , 110 nttt 和 Iiiiji n 110 , , 有 1 1 1 0 01n n n nnnP X t j | X ( t ) i , X ( t ) i , , X ( t ) iP X ( t ) j | X ( t ) i , ( ) ( 2.4.2) 6 则称 )( tX 是连续时间离散状态的马尔柯夫链 , 简称连续时间 马氏链 . 定义 2.4.2 中的链表明状态空间 I 是离散的 , 和离散时间马氏链情况相同 , 我们称具有性质 0,)0(|)()(| tsiXjtX
21、PisXjstXP ,)( ( 2.4.3) 的马氏链为时齐马氏链 .时齐性表明转移概率 isXjstXPtp ij | (2.4.4) 与起始时间 s 无关 . 连续时间马氏链的性质( 2.4.2)和离散时间马氏链的性质( 2.4.1)在形式上相同的 , 因此对离散时间马氏链得到的许多结论对于现在的马氏链仍然有效 , 举例如下 : ( 1) 对于 0t , 已知 itX )( 的条件下 , 将来 tuuX |)( 与过去 tvvX 0|)( 独立 .也就是说 , 在概率 )()( itXPPi )(| 下 , 随机过程 tuuX |)( 与 tvvX 0|)( 独立 . ( 2) CK 方程 : 对任何 0, st , 有 Ik kjikij sptpstp )()()(或 )()( tPsPtsP )( , (2.4.5) 其中 Ijiij tptP ,)( )((2.4.6) 称为马氏链 )( tX 的转移概率矩阵 . (3) )( tX 的概率分布由转移概率矩阵 2.3.6和 )( 0X 的概率分布 .0,00 21 )()()( ppp (2.4.7) 唯一决定 : )()()( tpptp 0 . (2.4.8) 其中 0,) ,.(),( 21 ttptptp )( , IiitXPtp i ,)()( . 3 马尔柯夫链关于成绩预测的模型及应用