1、数据挖掘与应用Data Mining and Its Application张俊妮北京大学出版社* 1第一讲 数据挖掘概述Date 2什么是数据挖掘决策与运营活动经验数据新知识数据挖掘是一个持续改进企业经营管理活动的过程 : 把组织在决策与运营活动中所积累的经验,转换为可度量的数据。 对其进行分析后 ,提炼出对运营管理有指导意义的新知识。 进一步改进决策、改善运营活动。Date 3什么是数据挖掘定义: 数据挖掘是对大量数据进行探索和分析、以便发现有意义的模式和规则的过程 。 (Berry and Linoff, 2000)Date 4数据挖掘的应用 以客户为导向的应用 :市场篮分析、获取客户、
2、客户细分、客户保持、交叉销售、向上销售、客户终身价值分析等 。 以运营为导向的应用 :盈利分析、定价、 欺诈 发现、风险评估、雇员流失分析 、生产效率分析等 。Date 5案例一:银行业【 应用一 】测度企业货款信用风险需要考虑 2个方面: 企业货款违约的概率; 一旦企业违约所带来的损失。如果银行能够很好地预测信用风险,那么它就可以: 基于自身的风险偏好选择客户群体; 为不同的客户提供不同的货款产品或不同的货款利率。Date 6最大程度地减少这两类错误,将会为银行带来可观的收益。判断为不违约者 判断为会违约者实际不会违约的企业正确 失去潜在的业务和盈利机会实际会违约的企业产生大量的信用损失(贷
3、款的本金、利息等) 正确违约事件的预测可能产生的两类错误Date 7信用风险分析的范式变革在 20世纪 90年代早期美国经历经济衰退之前,大多数美国银行及穆迪、标准普尔等风险分析仲裁机构的决策依赖于信货人员、信用调查分析人员等的专家意见,很少使用基于统计方法的风险分析。 这次危机之后,美国银行等开始重视如何更加一致地诠释并管理风险。Date 8数据仓库和信用风险建模它们采用数据仓库和数据挖掘技术来加以解决: 对大量数据进行收集、存储和维护; 应用高级建模方法对信用风险进行建模; 对所使用的模型进行经常性的监测和修正。巴塞尔协议就特别强调银行内部的信用风险管理,因此在这些新技术的支撑下,美国银行等建立起了内部评级模型,对风险进行预测和控制。Date 9数据收集 反映企业财务状况的年度财务报表; 企业所处行业的总体情况; 企业的市场地位; 企业管理质量; 企业管理层的风险偏好; 审计报告的质量; 企业开业时间; 企业作为银行客户的时间。重点关注: 违约行为的确认; 有违约行为的企业在违约之前的各种信息。Date 10