企业管理二分类问题研究综述.doc

上传人:gs****r 文档编号:1754241 上传时间:2019-03-14 格式:DOC 页数:6 大小:106KB
下载 相关 举报
企业管理二分类问题研究综述.doc_第1页
第1页 / 共6页
企业管理二分类问题研究综述.doc_第2页
第2页 / 共6页
企业管理二分类问题研究综述.doc_第3页
第3页 / 共6页
企业管理二分类问题研究综述.doc_第4页
第4页 / 共6页
企业管理二分类问题研究综述.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、1企业管理二分类问题研究综述摘要:通过梳理企业管理领域的二分类问题,发现二分类支持向量机广泛应用于客户流失预测、上市公司财务困境预警和信用风险评估。并且为了提高预测精度,学者不断改进该模型:为适应具体数据特征,如数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等,相应引入模糊、加权、双隶属支持向量机以及代价敏感性学习机制等。 关键词:二分类支持向量机(SVM) 企业管理 综述 1 概述 当前,企业管理领域中的客户流失预测、公司财务困境预警、信用风险评估已成为学术界和业界关注的焦点,能否科学合理的对其进行预测,关乎企业生存和发展。利用客户静态属性数据,预测客户是否流失;利用公司财务、经营情

2、况,预测上市公司是“财务状况正常”或“财务状况异常” ;利用借款人财务、非财务状况,预测其信用状况是“正常”或“违约” 。虽然上述 3 领域研究方向差异性大,但研究使用方法相似,因此将上述 3 领域研究统称为经济与管理科学领域二分类问题研究,简称二分类问题研究。 以上二分类问题研究利用判别分析,取得了相对准确的理论结果,但该方法需要很强的假设和限制条件,而这些条件在实际分析中通常得不到满足。近年来,随着人工智能学科的发展,学者引入神经网络,并取得了优于判别分析法的结果。但神经网络很可能陷入局部最优,无法2得到全局最优,同时它是基于经验风险最小化原理,经常出现“过拟合”现象。1995 年 Vap

3、nik 提出支持向量机模型(Support Vector Machine,SVM) ,一种基于结构风险最小化的算法。之后学者将 SVM 进入上述二分类问题研究,发现其泛化能力、预测精度都高于判别分析、神经网络。 近年来,为提高二分类问题研究中 SVM 预测精度,学者不断探索如何改进二分类 SVM,有效降低样本数据外点或噪声点、非平衡性、重叠性及错分代价差异性的影响。 本文结构安排如下:第一部分是引言,第二部分是考虑样本特征的改进支持向量机,第三部分是结论与展望。 2 改进支持向量机 随着人工智能领域的快速发展,学者将传统支持向量机(C-SVM)引入二分类问题研究:Min 和 Lee 将 C-S

4、VM 引入上市公司财务困境预测,夏国恩等将 C-SVM 引入客户流失预测,发现 C-SVM 优于传统判别分析、神经网络。但此阶段仅限于对模型的简单应用,未充分考虑样本数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等。 2.1 外点或噪声点 当数据集中存在外点或噪声点时,容易使二分类 SVM 结果不理想,为此 Liu 和 Huang 将模糊化思想引入 SVM,提出了模糊支持向量机(FSVM) ,根据数据点对所在类(正类、负类)的相对重要程度,分配不同的权重,以降低外点和噪声点影响。杨海军、太雷将模糊支持向量机(FSVM)算法引入上市公司财务困境预测,对沪深两市按行业板块分类3的上市公司实

5、证分析,显示该模型预测优于 C-SVM。 2.2 重叠性 传统 SVM 将样本集绝对分为互斥的两类,但现实世界中这种分类不存在经济意义,即样本很可能存在重叠性,例如财务困境预测时,财务指标既定的企业,可能由于经营远离财务困境,也可能由于经营不力而陷入财务困境。 考虑样本数据重叠性、外点或噪声点,Wang 等构建了双隶属模糊支持向量机(B-FSVM) ,使每个样本点依据隶属函数同时属于两类,并利用3 个公开信用数据库实证分析,发现 B-FSVM 判别能力高于 C-SVM 和FSVM。阚宝奎、刘志新等1将 B-FSVM 引入上市公司虚拟财务报告识别,其中样本点对于两类样本的隶属程度确定采用谱聚类方

6、法。研究发现,该模型的判别准确率、泛化能力都显著优于 C-SVM、BP 神经网络,且可以显著降低将虚假财务报告识别为真实财务报告的错误。 张目、周宗放2采用多目标规划,减少两类样本企业信用状况的重叠。基于 TOPSIS 法,分别以“正常企业”样本逼近理想点、 “违约企业”样本逼近负理想点为目标,构建多目标规划模型;运用实码加速遗传算法求解得出指标综合权重,通过构造加权样本,减少两类样本企业信用状况的重叠,进而提高 SVM 预测精度。选取沪、深股市中具有“高新技术概念”上市公司作为实验样本,实证分析得出,该方法一定程度上利于两类样本的正确区分,使 SVM 的预测精度提高。 2.3 非平衡性 经济

7、与管理科学中的二分类问题数据大多存在非平衡性,而非平衡4性会对 C-SVM 分类效果产生不利影响,即 C-SVM 只会对数量上占优的类别具有很强的识别能力3。解决数据非平衡性可使用向下采样方法或构建相应模型。向下采样方法:以客户流失预测为例,从非流失客户中抽取部分样本与流失客户样本构成 k:1 的训练集。这种方法虽然平衡了训练集类分布,但损失了很多信息,且抽取比例、k 取值确定需要多次尝试和实验。 应维云、覃正等4考虑到流失客户和非流失客户正负样本数据不平衡,引入分类加权支持向量机算法(CW-SVM) ,对深圳市某银行个人信贷部的客户信贷数据分析,结果表明 CW-SVM 要好于神经元网络和决策

8、树方法。其中 CW-SVM 算法,能够通过调整类权重参数,改变分类面位置,进而提高算法分类准确性。 2.4 错分代价差异性 二分类问题研究,很难使用传统的基于预测准确率的模型解决,如客户流失、信用评估等,这些问题中不同类别样本的错分代价相差很大。解决错分代价差异问题,可以通过样本数据的预处理,也可以通过引入错分代价差异:阚宝奎、刘志新等考虑到人们对于两种判别错误的“厌恶程度差异” ,在双隶属 SVM 建立时,对训练样本进行“非对称”处理(将虚假财务报告视为绝对属于虚假财务报告,而所谓的真实报告“谨慎”对待,进行双隶属分析) 。这种新方法在公司财务报告真伪判别时,表现出了高于 C-SVM 和 B

9、P 神经网络的判别准确率、泛化能力,并且显著降低了将虚假财务报告识别为真实财务报告的错误。钱苏丽、何建敏等5将错分代价纳入分类算法,同时考虑数据不平衡问题,建立了代价敏5感支持向量机,使算法基于代价而非基于准确率。利用中国电信某分公司预付费小灵通用户数据实证,显示改进 SVM 能显著提高模型效能,且模型能够在两类错误(将流失客户错误预测为不流失客户、将不流失客户预测为流失客户)中找到一个平衡点使代价最小,弥补了传统模型默认代价相同、一味追求准确率的不足。 3 结论与展望 当前,对客户流失预测、财务困境预警、信用风险评估的研究方兴未艾,继传统统计模型、神经网络等,学者引入支持向量机。总体看来,二

10、分类支持向量机预测精度、泛化能力都高于其他模型,同时为了进一步提高其效果,学者不断研究:针对数据特征(存在外点或噪声点、非平衡性、重叠性、错分代价差异性等)相应引入模糊支持向量机、加权支持向量机、双隶属支持向量机以及代价敏感性学习机制等。虽然有关二分类支持向量机的研究趋于成熟,但仍存在一定的局限性:目前仍没有很好的方法指导针对具体问题的核函数选择,缺乏有效方式将二分类问题扩展为多分类问题研究,将是未来研究方向。 参考文献: 1阚宝奎,刘志新,宋晓东,杨众.改进支持向量机在虚假财务报告识别中的应用J.管理评论,vol.24,2012(5). 2张目,周宗放.基于多目标规划和支持向量机的企业信用评

11、估模型J.中国软科学,vol.4,2009(5). 3Gang Wu,Edward Y.Chang.Class-Boundary Alignment for Imbalanced Dataset LearningC.ICML Workshop on Learning from 6Imbalanced Data Sets II,Washington DC.2003. 4应维云,覃正,赵宇,李兵,李秀.SVM 方法及其在客户流失预测中的应用研究J.系统工程理论与实践,Vol.7,2007(7). 5钱苏丽,何建敏,王纯麟.基于改进支持向量机的电信客户流失预测模型J.管理科学,vol.20,2007(2). 作者简介:牛轩(1989-) ,女,河北新乐人,硕士研究生,研究方向:市场调查。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 学科论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。