1、毕业论文 文献综述 电气工程及自动化 SOM神经网络与实习成绩分类评判 摘要: 针对学生实习成绩评判的问题,提出了基于自组织特征映射( SOM)神经网络的评价方法,SOM 神经网络的原理、方法及其应用,研究如何运用 MATLAB 中有关神经网络的专用语言把 SOM神经网络结构模型变为程序模型, 用 MATLAB 编写 SOM 网络程序来 实现对实习成绩的综合评判系统的设计 。根据分析结果,证明评价方法在技术上的可行性,能够较为客观合理的对学生的学习情况做出评价。 关键词: SOM;神经网络; MATLAB;实习成绩; 1 实习成绩评判的研 究现状 随着教育事业的不断发展,如何对一个学生的实习成
2、绩给出较为精确合理的评价已经越来越被学生们关注,合理的评价可以检测学生的实习情况,评价教师的教学效果,有利于推动和促进教学水平的不断提高,以及学生学习的积极性。 目前在对学生学习成绩评价体系的研究中,采用的评价方法主要有因子分析法,模糊聚类分析法,相似聚类分析法,统计分析法等 1-3。 而 学生实习成绩的评定过程中,各评定指标内容往往更适合定性评价,不适宜定量表示,因此对实习成绩的综合评定带来一定的难度。 2 人工神经网络的发展 神经网络的研究可以追溯到 19 世纪末期,其发展历史可以分为 4 个时期。第一个是启蒙时期,开始于 1890 美国著名心理学家 W.James 关于人脑结构与功能的研
3、究,而后发表感知器一书。第二个时期为低潮期,开始于 1969 年结束语 1982 年。第三个为复兴时期,开始于 J.J.Hopfield 的突破性研究论文,结束于 1986 年。第四个时期为高潮时期,以 1987 年首届国际人工神经网络学术会议为开端,迅速在全世界范围内掀起人工神经网络的研究应用热潮。 芬兰赫尔辛基大学教授 Teuvo Kohonen 基于生物的“侧抑制”现象提出了自组织映射网络(self-organizing map SOM),作为一类无监督学习的神经网络模型 45,它能够对输入模式进行自组织训练,然后分为不同的类型。 Kohonen 认为,处于空间不同区域的神经元有不同的分
4、工,当一个神经网络接受外界输入模式时,将会分为不同的反应区域,各区域对输入模式具有不同的响应特性6。在网络结构上,自组织竞争人工神经网络一般由输入层和输出层构成的两层网络,输出层也称为竞争层 7。 SOM 网络的一个典型特性就是在一维或者二维的处理单元阵列上,形成输入信号的特征拓扑分布,因此自组织映射网络的主要目的是 将任意维数的输入信号模式转变为一维或二维的离散映射,并且以拓扑有序的方式自适应实现这个变换 8。 3 SOM 网络学习算法及应用 学习过程主要有 6 个步骤: 初始化。对 N 个输入神经元到输出神经元的连接权值赋予较小的权值。 提供新的输入模式 X。 计算欧式距离 dj,即:输入
5、样本与每个神经元之间的距离,并计算出一个具有最小距离的神经元 j*,即确定出某个单元 k,使得对于任意的输出神经元 j 都有 dk=min(dj) 给出一个周围的领域。 按照公式修正输出神经元 j*及其“邻接神经元”的权值。 计算输出(一般为 0-1 函数或其他非线性函数)。 提供新的学习样本直到学习速率衰减到设定值。 SOM 算法 9以其所具有的诸如拓扑结构保持、概率分布保持、无导师学习及可视化等特性吸引了广泛的注意,各种关于 SOM 算法应用研究的成果不断涌现,现已被广泛应用于语音识别、图像处理、分类聚类、组合优化 (如 TSP 问题 )、数据分析和预测等众多信息处理领域。 4 基于 MA
6、TLAB的 SOM神经网络研究 表征一个神经网络特性 10的关键是网络的激活函数,对于多层网络可以将前一层的 输出作为后一层的输入,而一层一层地计算直至网络的输出 11-12。在 MATLAB 环境下的神经网络工具箱中对于单层网络输出的计算,对于给出输入矩阵 P,权矩阵 W 和偏差矩阵 B 的单层网络,只要简单地选用相应的激活函数,就能够求出网络输出矩阵,所有的运算直接以矩阵形式进行。 一个待建模系统的输入 -输出就是神经网路的输入 -输出变量。这些变量可能是事先确定的,也可能不够明确,需要进行一番筛选。输入量必须选择那些对输出影响大且能够检测或提取的变量,此外还要求各输入变量之间互不相关或相
7、关性很小,这是输入量选择的两条基本 原则 。 输入变量可分为两类:一类是数值变量;一类是语言变量。数值变量的值是数值确定的连续量或离散量。语言变量是用自然语言表示的概念,其“语言值”是用自然语言表示的事物的各种属性。当选用语言变量作为网络输入变量时,需要将其语言值转换为离散的数值量。 输出层的神经元排列成哪种形式取决于实际应用的需要,排列形式应尽量直观反映出实际问题的物理意义 13。 输出层设计涉及两个问题:一个是节点数的设计;另一个是节点排列的设计。节点数与训练集样本有多少模式类有关。如果节点数少于模式类数,则不足以区分全部模式类,训练的结果势 必将相近的模式类合并为一类。如果节点数多于模式
8、类数,一种可能是将类型分得过细,而另一种可能是出现“死节点”。 在解决分类问题时,如果对类别数没有确切信息,宁可先设置较多的输出节点,以便较好地映射样本的拓扑结构,如果分类过细,再酌情减少输出节点。 5 SOM 神经网络的优点与局限性 (1)具有统一的内部知识表示形式,通过学习程序即可获得网络的相关参数如分块邻接权矩阵、节点偏移向量等。任何知识规则都可变换成数字形式,便于知识库的组织和管理,通用性强 ; (2)便于实现知识的自动获取; (3)利于实现并行联想推理和自适 应推理; (4)能够表示事物的复杂关系如模糊因果关系。 当然 SOM 网络的研究目前还不成熟,还存在一些局限性,比如: (1)
9、网络结构是固定的,不能动态改变; (2)网络训练时,有些神经元始终不能获胜,成为“死神经元”; (3)SOM 网络在没有经过完整的重新学习之前,不能加入新的类别; (4)当输入数据较少时,训练的结果通常依赖于样本的输入顺序; (5)网络连接权的初始状态、算法中的参数选择对网络的收敛性能有较大影响。 6 总结与展望 应用 SOM 神经网络和 MATLAB 工具 14,可以在实习学生数较多,尤其当评 定指标较多的情况下,较轻松地给出学生实习的总评成绩。而且评价结果更可靠 , 可操作性更强 , 整个评价步骤明确。 但是 无导师学习现在发展得的还不成熟, SOM 网络还有很多问题需要进一步研究,比如:
10、 SOM 网络从高维映射到低维时会出现畸变,压缩比越大,其畸变程度越大。如何改进 SOM 结构,减小 SOM 网络的训练时间以及如何确定 SOM 法中的参数问题,也是今后需要深入研究的重点之一。 参考文献 1 王雅 ,杨启耀 . 基于相似聚类分析的毕业设计成绩评价体系研究 J.黄石理工学院学报 ,2010,6, 26(3). 2 张琼 . 因子分析在学生成绩综合评价中的应用 J. 惠州学院学报 ( 自然科学版 ), 2010,6, 30( 3) . 3 张秀梅 ,王涛等 . 模糊聚类分析方法在学生成绩评价中的应用 J. 渤海大学学报 (自然科学版 ),2007, 6, 28(2). 4 Mar
11、tin T. Hagan.etc.Neural Network DesignM.北京 :机械工业出版社 ,2002,8. 5 KIANG M Y. Extending the kohonen self-organizing map network for clustering analysisJ. Computational Statistics and Data Analysis, 2001, 38(2):161-180. 6 Kohonen T.Self-organized formation of topologically correct featuremapsJ.Biological
12、 Cybernetics,1982, 4(3):59-69. 7 闻新等 .MATLAB 神经网络应用设计 M.北京 :科学出版社 ,2000, 9. 8 Simon Haykin.Neural Networks:a comprehensive foundationM.北京 :机械工业出版社 ,2004,1. 9 焦李成 .神经网络系统理论 M.西安 :西安电子科技大学出版社 ,1990, 12. 10MATLAB 中文论坛 . MATLAB 神经网络 30 个案例分析 M.北京: 北京航空航天大学出版社 , 2010,4. 11丛爽 .面向 MATLAB 工具箱的神经网络理论与应用 M.合肥 :中国科学技术大学出版社 ,1998, 11. 12飞思科技产品研发中心 .神经 网络理论与 MATLAB 7 实现 M.北京:电子工业出版社, 2005,3. 13韩力群 .人工神经网络教程 M.北京 :北京邮电大学出版社 ,2006, 12. 14高隽 .人工神经网络原理及仿真实例 M.北京 :机械工业出版社 ,2003,7.