664例崩漏医案信息的数据挖掘.doc

上传人:99****p 文档编号:1992685 上传时间:2019-03-26 格式:DOC 页数:5 大小:25KB
下载 相关 举报
664例崩漏医案信息的数据挖掘.doc_第1页
第1页 / 共5页
664例崩漏医案信息的数据挖掘.doc_第2页
第2页 / 共5页
664例崩漏医案信息的数据挖掘.doc_第3页
第3页 / 共5页
664例崩漏医案信息的数据挖掘.doc_第4页
第4页 / 共5页
664例崩漏医案信息的数据挖掘.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、664 例崩漏医案信息的数据挖掘作者:李园白,杨阳,崔蒙,尹爱宁,奚怀平,于琦,董燕【关键词】 崩漏;医案;数据挖掘数据挖掘是 20 世纪 80 年代末兴起的信息分析技术,而关联分析是数据挖掘中一项常用的技术,已经广泛应用于银行和零售行业的信息分析,为商家带来了巨大的经济效益。近年来,该项技术开始被应用于分析中医药数据,并已取得一定的成果。笔者利用此项技术对 664 例崩漏医案数据进行关联分析,期望为崩漏病的相关研究提供参考。1 数据采集与规范采集了 19722005 年公开发表的期刊和专著文献中崩漏医案共664 例。崩漏病证的诊断参考国家中医药管理局 1994 年颁布的行业标准1。本研究采集

2、了医案中的症状、证型、中药三部分信息数据,并把数据予以规范。由于中医医案中用词极其不规范,可供参考的工具书有限,使数据规范工作量巨大而困惑。例如:医案中描述“体瘦”这一症状时,可以有“形体消瘦” 、 “形体瘦削” 、 “身瘦” 、 “羸瘦” 、 “消瘦” 、 “瘦弱” 、“形体消索”等多种表达方式;证型描述“血瘀”,又有“血滞” 、 “血凝”、 “瘀血”等多种表达方式。中药部分相对规范,但也有大量的异名现象,例如:山茱萸有 9 个别名(包括:萸肉、山萸肉、枣皮、杭萸肉、净萸肉、山萸、山芋肉、陈萸肉、杭山萸)。这些不规范现象必须解决后方能形成结构化数据库,才能开展下一步数据挖掘。本研究根据症状、

3、证型、中药这三部分不同的用词特点分别进行了规范。1.1 症状、证型用词规范本研究把医案中症状、证型拆分为最小的主谓词组。症状(主谓词组)主语部分(病位)谓语部分(病状),例如:腹痛腹(主语)痛(谓语)。证型(主谓词组)主语部分(病位)谓语部分(病性),例如:血瘀血(主语)瘀(谓语)。规范后用词一方面参考中国中医药学主题词表2、 中医诊断学3、 简明中医辞典4等书籍;另一方面把原文中症状或证型的同义词归类,选择其中使用次数最频繁的词,也就是说同义症状和同义证候中,哪一种证候或症状名用的最多,最后就使用该词作为规范后用词。1.2 中药规范以参考权威书籍为中心,依次参考中华人民共和国药典(2005年

4、版) 5、 中药大辞典6、 中华本草7,中草药的异名、别名现象规范除参考前述 4 个书籍外,还参考了一些别名词典。中药炮制方法在正名后面注明。规范后格式为“正名(炮制方法)”,例如“甘草(炙)” 。中成药治疗、针灸治疗等未包含在本数据库中。2 数据挖掘通过数据的采集和规范,已经形成了一个小型的结构化的数据库,包含了 664 例崩漏医案的症状、证型、中药信息,然后再利用数据挖掘软件对数据库进行关联分析,软件采用中国中医科学院开发的开源软件weka。最终得到 3 张结果表,分别是“崩漏病高频药物组结果表” 、 “崩漏病高频药物症状组结果表” 、 “崩漏病高频”药物证候”组结果表。见表 1表 3。表

5、 1 崩漏病高频药物组结果表(略)表 2 崩漏病高频”药物症状”组结果表(略)表 3 崩漏病高频“药物证候”组结果表(略)3 结果分析下面以白芍-当归为例详细描述项目集置信度和支持度的计算方法。见表 4。表 4 白芍-当归关联分析结果表(略)表 4 中支持度:白芍当归(支持度)17%,计算方法:白芍当归(支持度)白芍、当归同时出现的医案数 112/崩漏总医案数(664 例)17%。解析:也就是说,同时含有(白芍当归)这一对药的医案数为 112个医案,这代表了这一对药在医案中的使用频繁程度。表 4 中置信度:白芍当归(置信度)48%,当归白芍(置信度)41%,计算方法:白芍当归(置信度)白芍、当

6、归同时出现的医案数112/单独白芍出现的医案数 23148%,当归白芍(置信度)白芍、当归同时出现的医案数 112/单独当归出现的医案数 27241%。解析:白芍当归(置信度)就是出现白芍的 231 个医案中有 112 个同时出现了当归。当归白芍(置信度)就是出现当归的 272 个医案中有 112 个同时出现了白芍。也就是说有白芍的时候几乎一半的医案同时出现了当归,而出现当归的时候有 40%都出现了白芍。同理,可以理解表 2、表 3 中的结果,例如表 2 中“当归经血量多”支持度 19.58%,置信度 48.00%的含义就是在崩漏病的医案中有近 1/5 的医案同时出现了当归和经血量多,而当处方

7、中出现当归的时候,有接近一半的患者有经血量多这个症状。表 3 中,“桃仁瘀”支持度为 5.57%,置信度 93%,也就是说,医案中同时出现桃仁和瘀信息的医案占总医案数的5.57%,而处方中出现桃仁的医案有 93%都含有辨证信息瘀。4 结语本研究通过搜集崩漏医案 664 例,经过规范后形成崩漏医案数据库,再利用数据挖掘软件处理数据,获得症状、证型、中药三部分关联关系的分析结果。在以往的医案分析中,多是作者阅读医案后进行模糊的理解和认识,虽然有一些医案信息的用药统计,但远远不能定量分析出医案中所蕴藏的规律。通过此次数据挖掘的研究,把其分析关联关系的原理试验性地应用于医案信息的分析研究,可以把症状-证型-中药的关系量化表达,使前人的经验可以更好地被表现出来。【参考文献】1 国家中医药管理局.中医病证诊断疗效标准S.南京:南京大学出版社,1994.2 吴兰成.中国中医药学主题词表M.北京:中医古籍出版社,1996.3 邓铁涛.中医诊断学M.上海:上海科学技术出版社,2002.4 李经纬.简明中医辞典M.北京:中国中医药出版社,2001.5 国家药典委员会.中华人民共和国药典(一部)S.北京:化学工业出版社,2005.6 江苏新医学院.中药大辞典M.上海:上海人民出版社,1977.7 国家中医药管理局.中华本草M.上海:上海科学技术出版社,1999.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。