1、基于循证医学的海量医学数据挖掘系统的设计及初步应用研究摘要:本文介绍了基于循证医学的海量数据挖掘系统设计及应用。该系统利用区域卫生信息平台中的相关数据,对传染病、慢性病,及门急诊等指标的分析预测,实现了基于循证医学的医学数据挖掘分析,较大地提升了区域医疗决策水平。 关键词:数据挖掘;循证医学;区域卫生信息平台;分析平台 1 引言 随着大数据时代的到来,数据挖掘和模式识别已经逐渐成为新的医学科学研究范式。而临床大数据集具有数据格式多样、复杂且难于统一,使得很大一部分临床数据得不到有效的利用。因此,如何根据循证医学特点,合理利用数据挖掘技术,获取有价值的治疗证据是循证医学的关键所在。 宁波市区域卫
2、生信息平台自 2013 年建设开始,目前已接入市属 8 家医疗机构和鄞州区、海曙区、江东区、江北区、镇海区、奉化市、余姚市、慈溪市、宁海县、奉化县等区市县级平台以及市级公共卫生专业机构,实现了医疗服务信息和公共卫生服务信息的采集与交换。 本文从循证医学视角出发,构建电子健康档案和电子病历信息资源整合与挖掘的宏观模型和数据分析系统,对数据采集、数据挖掘等几环节进行设计,把纷繁复杂的医疗数据转变成有价值的信息,初步实现了对医学数据的交融扩展及挖掘分析的目的,为医学科学研究、临床诊疗、卫生决策、公众服务制定提供依据,其中包括:帮助寻找最佳药物组合及标准化治疗方法,提高诊疗效果;预测慢性疾病风险,查明
3、罹患疾病几率;协助医院评估、监测和提高患者治疗的安全性;优化医院资源利用等等。 2 系统的架构及功能 系统采用 B/S 结构、面向对象的设计,以 C#作为开发工具结合MSSQLServer 数据库技术开发而成。系统由数据采集、数据管理、数据应用、平台访问、平台管理五大类模块组成1。 平台功能可分为智能报表分析、动态表单管理、动态数据库管理、动态数据库管理以及动态数据接口管理。系统采用高性能的缓存机制,确保网站访问速度;采用强大的安全机制,防止各种注入式攻击等漏洞;系统充分考虑了底层大数据量并发的性能问题。 3 系统的应用 3.1 统计分析 统计数据分为传染病数据、高血压数据及门急诊数据三大类别
4、,各类数据可根据时间、地区、患者年龄、患者涞源、性别、职业、疾病等进行分项统计。数据展示形式可分为曲线图、柱状图、饼图、漏斗图等。 3.1.1 传染病统计 系统可将传染病报告例数按年份、月份、地区、年龄、性别、职业、疾病病种进行分项统计;图 1、图 2 中分别显示了2011 年2014 年传染病报告例数的逐月分析和按病种分析。 3.1.2 高血压统计 根据系统对已进行登记管理的高血压人群相应地区、年龄、性别的统计分析,我们可以对高血压病的易感人群开展重点防控。见图 3。 3.1.3 门急诊分析 门急诊统计可以对宁波市属各医疗机构及全市总门急诊量进行逐月统计。见图 4。 3.2 数据预测 3.2
5、.1 算法介绍 数据预测采用了移动平均算法,移动平均法是用一组最近的实际数据值来预测未来一期或几期内数据的一种常用方法。移动平均法适用于即期预测、能有效地消除预测中的随机波动。 移动平均法是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。因此,当时间序列的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出事件的发展趋势时,使用移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势(即趋势线) ,然后依趋势线分析预测序列的长期趋势2-3。 移动平均法可以分为:简单移动平均和加权移动平均,系统采用的是简单移动平均
6、算法。简单移动平均的各元素的权重都相等。简单的移动平均的计算公式如下: Ft=(At-1+At-2+At-3+At-n)/n 在此公式中,oFt 表示对下一期的预测值;on 表示移动平均的时期个数;oAt-1 表示前期实际值;oAt-2,At-3 和 At-n 分别表示前两期、前三期直至前 n 期的实际值。 3.2.2 预测效果 3.2.2.1 传染病预测 根据 2011 年 1 月2014 年 12 月这一段时间的传染病数据,运用移动平均算法对数据进行处理,预测 2015 年度宁波市传染病发病数量预测,见图 5。 3.2.2.2 门急诊预测 在宁波市某医院 2014 年门急诊量数据的基础上,
7、运用移动平均算法对 2015 年该院的门急诊量进行预测,图 6 为 2014年该医院的门急诊量统计,预测结果见图 7。 4 讨论 该数据挖掘系统有效地利用了区域卫生信息平台中的海量数据,采用海量检索、人工智能和统计学等方法对宁波地区传染病、慢性病中涉及的循证医学统计指标进行分析,对医院门急诊量进行预测,有助于宁波地区医疗管理用户更加合理、有效地配置卫生资源及配套设施,为各项医疗计划的制定,及决策的实施提供可靠的理论依据。随着科技的进步,数据挖掘技术在疾病诊疗、药物应用,及医疗决策支持中的挖掘应用范围会越来越广,数据挖掘分析平台将衍生出更多面向具体问题的分析子平台,从而能够更好的为疾病诊疗带来保障。 参考文献: 1 孙向东,黄晓琴,朱春伦,等. 基于循证医学的海量医学数据挖掘分析方法研究J. 医学信息学杂志,2015, (3):11-16. 2邱宏,陈静. 移动平均趋势法在医院门诊量动态分析中的应用J.宁夏医学杂志,2012,34(9):932-934. 3陈辉,周雄辉,朱燕,等. 移动平均季节指数法在预测门诊量和出院人数中的运用J. 中国卫生统计,2012,29(2):312.编辑/金昊天