1、基于贝叶斯网络的企业开发 MIS 行为分析【摘要】在信息化时代,企业的生存与发展往往取决于获取信息量的多少以及对信息的利用状况,对于企业来说,增强对信息的管理能力也相当重要,因此开发管理信息系统也势在必行。本文根据先验知识选取分析变量,采集样本数据,建立贝叶斯网络模型进行企业开发管理信息系统(MIS)行为分析,应用 K2 算法和贝叶斯参数估计方法,进行了贝叶斯网络的结构学习和参数学习,建立了开发 MIS 行为分析贝叶斯网络,应用联合树推理引擎推理科学管理、业务量扩大等因素对企业开发MIS 行为的影响。 【关键字】贝叶斯网络,MIS,行为分析 1 引言 面对激烈的信息化市场竞争 ,企业的生存与发
2、展也越来越多的取决于获取信息量的多少以及利用率。一个现代企业必须能及时、全面、准确地获得市场信息,只有这样才能在市场竞争中立于不败之地。所以在企业中开发管理信息系统(MIS)已势在必行。管理信息系统(MIS)是一个覆盖全企业或主要业务部门的将管理科学、信息科学、计算机技术、通信技术有机融为一体,为管理决策提供服务的信息系统。MIS 能够实测企业各部门的运作情况、能用所得的各种数据预测未来 ,能够实现监控生产、辅助决策、控制企业的行为 ,帮助企业实现其规划的目标。 目前,企业开发 MIS 行为分析常用的方法有自动聚类、决策树和人工神经网络它们都要求数据量比较丰富,而且模型的训练有一定的困难。最主
3、要的一点,它们主要是通过历史记录来预测发展趋势,而企业开发MIS 行为是由领导重视信息化建设、系统安全问题等诸多复杂的因素造成的,这些因素在企业运营中中已经有了一定的认识,如果能将这些先验知识考虑进去的话,一方面可以降低对数据量的要求,另一方面可以增加预测的精度。本文将建立企业开发 MIS 行为贝叶斯网络模型,探索贝叶斯网络在决策企业开发 MIS 行为的应用。 2 贝叶斯网络 贝叶斯网络是概率分析与图论相结合的产物,是一种有向无环图,用于不确定知识的表达与推理。 2.1 贝叶斯网络的构建。贝叶斯网络模拟人的认知思维推理模式,表示不确定性的推理模型。贝叶斯网络 G=(S,P)由网络的拓扑结构 S
4、 和局部概率分布的集合 P 两部分组成,S 表示节点变量之间的关联,P 代表用于量化网络的一组参数。贝叶斯网络的语义和紧凑的表达使其能够从数据中进行有效的统计学习。 2.2 贝叶斯网络学习。贝叶斯网络由网络拓扑结构和局部概率分布的集合两部分组成, 因此贝叶斯网络学习可以被分解为两个阶段: ( 1) 网络拓扑结构的学习,即找出一个能够最真实地反映现有数据库中各数据变量之间的依赖关系的贝叶斯网络结构,简称为结构学习。 ( 2)在确定网络结构后,每个变量的局部条件概率分布 P 的学习, 简称为参数学习。 BN Took it(BNT)是 Kevin P.Murphy 基于 Matlab 语言开发的关
5、于贝叶斯网络学习的软件包,提供了许多贝叶斯网络学习的底层基础函数库,支持多种类型的结点(概率分布) 、精确推理和近似推理、参数学习和结构学习、静态模型和动态模型。因此,我们选择 BNT 作为贝叶斯网络学习的实验工具。 3 企业开发 MIS 行为分析贝叶斯网络构造 3.1 变量选择和数据预处理 应用太原市 2012 年各企业开发 MIS 行为调查数据(抽样率约为3.5%) ,经整理后组成由 4024 条样本数据组成的训练数据集,结合以往建模经验和企业开发 MIS 行为分析,筛选出领导重视程度、科学管理等五个变量,经过数据的离散化处理后各变量的取值情况如表 1 3.2 贝叶斯网络结构学习。结构学习
6、指利用训练样本集,结合先验知识,确定合适的贝叶斯网络拓扑结构,而 K2 算法是贝叶斯网络结构学习的常用方法。该算法在给定节点顺序这一先验信息的情况下,利用贝叶斯概率作为标准来评价模型与数据的符合程度,过不断向网络中增加能提高评价指针的便的贪婪搜索方法来找出最佳网络结构。以训练数据集为基础,应用 K2 算法和 Matlab 编程进行贝叶斯网络结构学习,得到如图 1 所示的企业开发 MIS 行为分析贝叶斯网络结构。 图 1 所示的企业开发 MIS 行为分析贝叶斯网络由 5 个结点和若干连线组成,其中,5 个节点即为 5 个变量,节点之间的连线表明变量间的相互影响关系,如 3.3 贝叶斯网络参数学习
7、。参数学习是在给定贝叶斯网络拓扑结构的情况下,确定各节点处的条件概率分布。常用的参数学习方法有贝叶斯(Bayesian)方法,即给定一个含有未知参数的分布以及一个完整的实例数据集合 c, 是一个随机变量,具有一个先验分布 p() ,可以根据以往的知识估计,或者认为 p()是一个均匀分布,参数 的信息发生变化,表示为 p(|c) ,称为参数 的后验概率。Bayesian 参数学习的任务就是计算这个后验概率。 在科学管理和业务量扩大的共同影响下,企业开发 MIS 的概率分布如表 1 所示: 4 企业开发 MIS 行为分析 应用贝叶斯网络,可以根据网络中任意一个或多个结点的值推断其他结点的值,常用的
8、推断函数有联合树传播算法、消元法、全局推断方法等,其中,联合树传播算法应用最为广泛,是所有精确推断引擎的根本。应用联合树推理引擎,预测推理领导重视程度和科学管理的边缘分布,分析各变量对业务量扩大和企业开发 MIS 的影响。 4.1 科学管理对企业开发 MIS 行为的影响。应用已经建立的企业开发MIS 行为分析贝叶斯网络,可以预测科学管理对企业开发 MIS 行为的影响,如图所示: 分析图中结果可知,科学管理是企业开发 MIS 的基础,管理信息系统是企业管理的体现,进行科学管理需要有企业现行的管理体系、流程组织和配套的计算机技术,而企业开发 MIS 的行为也是建立在企业科学管理的基础之上的,MIS
9、 建立在科学管理基础之上,是一种以计算机为辅助管理决策的应用系统。 4.2 业务量扩大对企业开发 MIS 行为的影响 分析图中结果可知,业务量的增加可以促进企业开发 MIS 这个行为,企业开发 MIS 行为需要是以企业业务量的提升为前提的。 4.3 领导重视程度对业务量扩大的影响 分析图中结果可知,领导重视企业的发展和组织协调关系,企业的业务量将会有很大的提升。 5 结语 本文应用 K2 算法和贝叶斯参数估计方法,进行了贝叶斯网络的结构和参数学习,建立了企业开发 MIS 行为分析贝叶斯网络,应用联合树推理引擎,预测推理分析了在企业科学管理、人员素质等因素的影响下企业开发 MIS 行为的变化。应用本文所建的贝叶斯网络可以进一步分析企业开发 MIS 行为后企业各部门之间的互动关系。本文的研究可以为企业决策开发管理信息系统提供依据。 参考文献: 1张连文,郭海鹏. 贝叶斯网引论M.京:科学出版社,2006. 2宗芳,张慧永,隽志才.基于贝叶斯网络的停车行为分析J.系统工程理论实践,2010,30( 5) : 948 -954. 3张海 综述, 黄子杰 审校,贝叶斯网络及其在心理领域的应用,现代预防医学,2007,34(7) 4叶进,程泽凯,林士敏,基于贝叶斯网络的电信客户流失预测分析,计算机工程与应用,2005.14(212)