ImageVerifierCode 换一换
格式:DOC , 页数:7 ,大小:108.50KB ,
资源ID:1911412      下载积分:10 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1911412.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(医保欺诈行为的主动发现.doc)为本站会员(gs****r)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

医保欺诈行为的主动发现.doc

1、1医保欺诈行为的主动发现提要 针对在医疗行业中存在的医疗保险欺诈行为,应当有合适的方法去及时发现并制止,只有这样才能使医疗保险金能真正落到实处。本文使用主成分分析、K-means 聚类分析等方法,并运用 MATLAB、SPSS等软件对数据进行分析,并对我国医保行业现状进行分析,为相关部门自动识别医保诈骗提供具体的模型及识别方法。 关键词:医保欺诈;主动发现;主成分分析;K-means 聚类 基金项目:国家级大学生创新项目(编号:201510378153) 中图分类号:D9 文献标识码:A 收录日期:2016 年 6 月 13 日 一、数据挖掘预处理 由于本文主要研究的是医保欺诈行为,所以数据处

2、理中只保留所有参保人员,将非参保人员的就诊拿药数据剔除,减少无关数据的干扰。 (一)数据清洗。针对本文的研究目的,有目的地进行数据清洗。首先是删除大量对于本次数据挖掘没有用的数据,只保留相关数据列;其次是对于缺失的必要数据采用数据归约的方法填补空缺。 (二)数据转换。将文本型、字符型数据转换为数字型数据,以方便后续研究。如用“1”和“0”代替性别的“男” 、 “女” ;将出生日期转换为患者年龄等。 二、医保欺诈行为主动发现模型 2(一)类型:医保卡持有人已死亡。这是最容易发现的骗保行为,故优先考虑该种类型的骗保行为主动发现。通过 MATLAB 编程对医保卡和身份证号列进行筛选处理,找到一个医保

3、卡 ID 对应多个医保手册号的情况。利用 MATLAB 软件进行筛选,将筛选出的 ID 利用 Excel 的 vlookup函数查找出对应的身份证号,找出嫌疑人的关键信息。可以将一卡两人用、一卡三人用的医保卡 ID 和医保手册号筛选出来。而病人也有死亡标志说明,可以查出死亡病人的 ID 再查找其医保卡消费情况,对比病人的死亡时间以及账单号的交易时间,若病人的死亡时间在前而交易时间在后,则为医保欺诈记录。根据所使用的数据表,暂未发现这类医保欺诈,但仍应该警惕,及时把死亡者的医保卡注销,避免这类医保欺诈的发生。(二)类型:医保卡持有人未亡。对预处理后的数据进行分析,可以发现病人的医保费用与参保人的

4、年龄、消费频率、消费药品的金额之间具有一定的关联性。本文主要从病人年龄与消费金额、病人消费频率与消费金额两方面的联系,发现异常可疑数据,并针对这些可疑数据进行分析,进一步鉴别其特征,判断是否属于医保欺诈行为。 1、模型:年龄医费模型。根据研究的数据对象,建立病人年龄与医保费用的关系模型,使用 SPSS 软件进行分析。首先将所有参保人的年龄分成十个阶段:09 岁、1019 岁、2029 岁、3039 岁、4049岁、5059 岁、6069 岁、7079 岁、8089 岁、90 岁以上。在此,根据医保欺诈的特点,医保欺诈的费用越高越有可能存在欺诈行为,故只考虑平均费用置信区间的上限无意义。人为将置

5、信区间设定为向上浮3动 10%。在 EXCEL 表中使用分类汇总操作,计算出各阶段医保支付费用平均值及平均费用置信区间的上限,如表 1 所示。 (表 1) 利用 EXCEL 画出图形,通过观测散点的分布情况来确定拟合函数,利用数理统计方法中的多元回归统计方法可以得到因变量与自变量之间的回归关系函数表达式。 (图 1) 在图中可以发现 60 岁以上的曲线呈明显上升趋势,于是建立分段函数,分别对 059 岁和 60 岁以上进行拟合,拟合的回归曲线如图 2 和图3 所示。 (图 2、图 3) 于是建立得到医保费用关于年龄的函数,如下: 在上述方程的基础上建立初步筛选规则:按病人的年龄找到对应的置信区

6、间,若发现病人的实际花费其所在区间上限,则该病人医保费用花费超过一般标准,具有医保诈欺的嫌疑,将对这些病人进行进一步具体审查。 (表 2) 2、模型:消费频率与金额模型。由于在医保欺诈中,骗保人通常使用的手段包括两种:一是拿着别人的医保卡配药;二是在不同的医院和医生处重复配药。这些行为使有医保欺诈嫌疑的病人所对应消费记录中,某个医保卡 ID 对应的药费明细存在记录多、频率大、药费总和高的特点。即消费金额高和消费频率高是医保欺诈一个最大的特征。于是,本文具体研究存在着这两种消费特征的医保记录,具体识别其中的医保欺诈行为,依据此种情况,可以将药费和频率等基于 k-means 算法进行聚类分析。 K

7、-means 算法是以数据点到原型的某种距离作为优化的目标函数,利4用函数求极值的方法得到迭代运算的调整规则。本文使用的 K-means 算法以欧式距离作为相似度测度,通过对某一初始聚类中心向量的最优分类,得到对应评价指标最小。算法采用误差平方和准则函数作为聚类准则函数。首先在 ACCESS 中进行数据预处理,再利用 SPSS 分析数据属性的特征,选择典型数据作为初始聚类中心,进行 k-means 聚类分析求出每个病人的消费频率与消费药品的总金额。 本文选择四类数据作为初始的聚类中心:1、消费频率高,消费金额大;2、消费频率低,消费金额大;3、消费频率高,消费金额小;4、消费频率低,消费金额小

8、。结果如表 3 所示。 (表 3)从表 3 中可以看出第一类数据含有 341 个样本,这类病人消费频率高且消费额大,可能存在医保欺诈行为。用这种方法可以快速发现所有有欺诈嫌疑的记录。 3、类型:医师、科室参与欺诈。当找出所有可疑的欺诈记录后,可以通过不同表之间的数据映射关系来找到与嫌疑人员有关的嫌疑科室、嫌疑医生,从而可以确定协助作案的科室医生,便于以后的重点监督和排查。 根据医保诈骗的作案特点,在某些情况下,科室可以通过伪造病历和票据通过医保报销,以骗取医保金,造成某些患者费用和频率较高。为了有针对性地对这类数据进行查找,根据这几个表的映射关系,筛选出与嫌疑人员 ID 有关的科室并且统计他们

9、与嫌疑人员进行操作的次数,以此进行查找。首先统计原始数据,原始数据有下医嘱科室与执行科室两种科室,在医保诈骗事件中,下医嘱科室的欺诈嫌疑较大,因此重点分析下医嘱科室信息。利用疑似人员的医保卡号筛选出与之相关的科室,5并统计出与这些疑似 ID 进行交易的次数来确定科室的嫌疑度。根据与嫌疑 ID 交易的次数进行排序,当某些科室的交易次数和与其相邻的科室样本突然发生较大变化,可以此作为分界点,划分出嫌疑科室。与嫌疑科室同理,可以采用同样的方法查询出嫌疑医生。由这种方法,可以找到医保欺诈事件高发的重点科室,这些科室可能本身存在嫌疑,或是较为容易被不法分子利用空隙进行医保欺诈。 三、医保欺诈数据分析 根

10、据数据处理的结果,发现我国医疗保险存在如下三类的欺诈现象:(1)医疗保险需求方的欺诈违规行为。在现实情况中主要表现有:冒名顶替就医、以药换药、倒卖药品等;(2)医疗保险服务提供方的欺诈违规行为。主要可能表现为:重复收费、虚报医疗费用、倒卖医疗票据等;(3)医疗保险服务提供方与需求方联合的欺诈违规行为。主要的欺骗手段有:在医院挂床、用物充药、帮助提供虚假证明、伪造虚假病历等。其中,第一类行为最为普遍,第二、第三类行为较少,但一旦发生将会发生严重影响。这些行为对我国的医疗保险基金造成严重损失,危害我国医疗保险基金的公平性与公正性。 四、对完善医保制度的建议 (一)进一步改革支付制度。在总额控制支付

11、模式的框架下,应当以总额预付为主,结合多种付费方式的复合型支付制度,综合考虑如按病种、床日、人头、项目付费等因素,从多个角度来合理定价,减少由于药费过高而使参保病人产生的骗保心理,让参保病人住的安心,让医保基金用到实处。 (二)建立医保信息智能网络平台。一个参保病人对应一个电子账6户,将病例电子化,详细记录病人的一切看病用药信息。该账户应做到全国甚至世界范围内共享。 (三)完善对医保定点医院的内部管理。合理划分基金管理机构的职责并做到权力制衡,建立医疗服务监督评价体系和奖惩制度。 (四)完善对医保定点医院的外部监督。加大对医保定点医院、医师以及各类机构的违规行为的查惩力度,如发现有医保违规行为

12、,将取消涉案医保医师的执业资质。 五、总结 前人的研究包括采用基于统计回归或神经网络思想的优化改进方法,而这些方法都属于辅助学习方法,需要基于一定量的已知数据,或拥有较为丰富的先验知识,以获取识别因子作为学习材料,用以主动识别其他大量数据中包含的可能欺诈数据。该方法的问题在于欺诈样本点的选取过于依赖人的主观性,对于普遍意义上欺诈数据的识别不具备较强的参考价值。 为避免人工筛选欺诈数据带来的主观误差,需要找到非辅助学习的方法。聚类分析法可以满足这一条件,但传统的聚类分析采用欧氏距离作为分类标准,不足之处在于将各种影响因素的重要程度视为相同的,会造成一些不重要的参量(如年龄)却和一些重要的参量(如

13、病人一个月之内的开药次数)同等的影响着最后的分类。 为解决该问题,本文将主成分分析引进聚类分析,成为基于主成分分析的聚类分析算法。主成分分析模型是一种降维的算法,可以有效地将存在欺骗行为的数据范围缩小化,减少数据的冗余性,并保持数据的7有效性。同时,聚类分析能够很好的反映类之间的关系,本文中的各个因素虽然是彼此独立的,但是对于存在欺诈行为的情况时,数据内部会产生相关性,通过聚类分析可以快速有效地掌握它们之间的关系。在改进的主成分聚类分析法中,将这两种统计方法的优势结合,相辅相成,以达到综合评价的目的。 主要参考文献: 1殷瑞飞.数据挖掘中的聚类方法及其应用基于统计学视角的研究D.厦门:厦门大学,2008. 2江小平,李成华,向文,张新访,颜海涛.K-means 聚类算法的MapReduce 并行化实现J.华中科技大学学报(自然科学版) ,2011.6.39. 3王文华.基于蚁群算法模糊聚类的图像分割D.重庆:重庆大学,2009.

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。