关联规则挖掘以仲景方配伍规律挖掘为例.ppt

上传人:h**** 文档编号:243701 上传时间:2018-07-27 格式:PPT 页数:44 大小:1.31MB
下载 相关 举报
关联规则挖掘以仲景方配伍规律挖掘为例.ppt_第1页
第1页 / 共44页
关联规则挖掘以仲景方配伍规律挖掘为例.ppt_第2页
第2页 / 共44页
关联规则挖掘以仲景方配伍规律挖掘为例.ppt_第3页
第3页 / 共44页
关联规则挖掘以仲景方配伍规律挖掘为例.ppt_第4页
第4页 / 共44页
关联规则挖掘以仲景方配伍规律挖掘为例.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、关联规则挖掘 以仲景方配伍规律挖掘为例,杨雪梅 博士中医证研究基地yxm_,目录,解决的问题关联规则相关理论基础SPSS CLEMENTINE中实现的关联规则挖掘算法案例:仲景方配伍规律挖掘,解决的问题关联,购物篮问题:顾客购买了牛奶后,购买面包的可能性有多大药性规律问题:是否酸味的药常入肝经?比例是多少?如果具有酸味,那么该药入肝经的比例会比入肝经药占全部药物的比例提升多少?处方问题:*专家处方中开出生姜*桂枝*白芍三味药用于治疗寒证的次数有多少?比例有多少?专家处方中开出生姜*桂枝*白芍三味药用于治疗寒证的比例与所治疗病证中寒证出现的比例之间的比值是多少?,处方集举例,1麻黄;桂枝;白芍2

2、麻黄;桂枝;白芍;干姜 3麻黄;白术;干姜 4桂枝;白芍;白术;干姜 5麻黄;桂枝;白术;干姜,目录,解决的问题关联规则相关理论基础关联规则分类关联规则兴趣度参数SPSS CLEMENTINE中实现的关联规则挖掘算法案例:仲景方配伍规律挖掘,关联规则,关联规则 (Association Rule)是形如R: AB的规则,满足AB= & sup(R)min_sup & conf (R)min_conf。其中,A,B均为属性集合,sup(R)为规则R的支持度,min_sup为最小支持度阈值;conf (R)为规则R的置信度,min_conf为最小置信度阈值。如:泽泻 白术 猪苓 = 茯苓,分类关联

3、规则,分类关联规则 (Class Association Rule)是形如R: CD的规则,满足CD= & sup(R)min_sup & conf (R)min_conf。其中,C为条件属性(或中药)集合,D为决策属性(或方剂分类);sup(R)为规则R的支持度,min_sup为最小支持度阈值;conf (R)为规则R的置信度,min_conf为最小置信度阈值。如:桂枝*生姜*白芍寒证,兴趣度参数,规则R的支持度定义如下:sup(R) = P(AB) ; P(AB)为A和B同时出现的概率;规则R的置信度定义如下:conf(R) = P(B|A); P(B|A)为在A出现条件下出现B的条件概率

4、。规则R的提升度定义如下:lift(R)= P(B|A)/ P(B);条件A的出现对B出现概率的提升,说明A与B之间的相关性,大于1为相关,小于1则不相关,兴趣度参数,支持度(support)、置信度(confidence)、提升度(或作用度,lift)是描述分类关联规则兴趣度的三项重要指标,支持度反映规则的普遍性,置信度反映规则的可靠性,提升度反应规则两侧属性之间的相关性,通常选择支持度、置信度、提升度均较高的规则作为发现的有趣模式。关联规则挖掘算法通常需要设置两个参数:即最小支持度阈值min_sup为5%;最小置信度阈值min_conf为50%。,关联规则举例,例如: 泽泻 白术 猪苓 =

5、 茯苓sup=0.1565; conf=0.9684; lift=2.24 共有591首脾胃湿热方中有92首方剂同时出现泽泻、白术、猪苓、茯苓四味中药,故规则的支持度为15.65%;因95首同时出现泽泻、白术、猪苓三味中药的脾胃湿热方中有92首方剂同时出现茯苓这味药,故上述规则的置信度为96.84%。因茯苓出现的概率43%,则提升度为2.24.,分类关联规则举例,例如:桂枝*生姜*白芍寒证 (sup= 5.6%, conf=60%, lift=1.71) 仲景方共268首,桂枝、生姜、白芍三味中药同时出现在治疗寒证方剂中的频数为15,桂枝、生姜、白芍三味药同时出现在仲景方中的频数为25,寒证出

6、现的概率=35%,则上述规则的支持度为:15/268=5.6%;置信度为:15/25=60%;提升度为:60%/35%=1.71。 若系统设置最小支持度阈值为5%,最小置信度阈值为50%,则该规则将作为发现的有趣模式(用药配伍规律)反馈给用户。,参数计算样例,麻黄桂枝,sup=? ; conf=? ; lift=?,目录,解决的问题关联规则相关理论基础SPSS CLEMENTINE中实现的关联规则挖掘算法数据格式需求模型建立与参数设置案例:仲景方配伍规律挖掘,数据格式需求表格格式,数据格式需求交易格式,目前通常收集的数据格式,CLEMENTINE中实现的关联规则挖掘算法需要的格式,模型建立与参

7、数设置,仲景方数据集运行CLEMENTINE建立数据流参数设置,数据流,数据源节点,类型节点,模型节点fields标签,模型节点model标签,目录,解决的问题关联规则相关理论基础SPSS CLEMENTINE中实现的关联规则挖掘算法案例:仲景方配伍规律挖掘问题仲景方数据集仲景方数据预处理仲景方配伍规律挖掘,事务格式,数据流窗口,数据源节点,类型节点设置,模型节点设置,结果节点,分析结果,问题,仲景方,即张仲景所创方剂,因其配伍严谨、疗效卓著,被后世尊奉为经方。总结张仲景的用药配伍规律分别从八纲中的寒、热、虚、实;病位中的表里、五脏六腑、六经、仲景方出处等角度分别总结张仲景治疗寒、热、虚、实等

8、诸证的遣方用药规律。,仲景方数据集,选择张仲景所著伤寒论中方剂113首,金匮要略中方剂205首,共318首方剂,构建了含“ID、方名、出处、功效、主治、药物组成”等字段的仲景方数据集。查看伤寒论、金匮要略原始数据查看仲景方数据集,仲景方数据预处理,空缺值处理中药名规范化药物组成结构化方剂排重方剂归类与结构化格式转换,仲景方数据预处理空缺值处理,删除无药物组成等信息的方剂7首,余311首方剂,查看原始数据,仲景方数据预处理中药名规范化,规范化 “药物组成” 字段中的中药名删除已不再使用的29味药物,如 “白鱼”、“鸡屎白 ”; 更改17味中药的名称,如“柏叶”改为“侧柏叶”;处理同药异名,“赤硝

9、”、“芒硝”、“硝石”规范使用药名“芒硝”;处理同名异药,如“芍药” 拆分为“白芍”与“赤芍”。经中药名规范化后,仲景方药物组成中涉及的药物由172味变为132味。,查看原始数据,仲景方数据预处理药物组成结构化,查看原始数据,仲景方数据预处理方剂排重,方剂排重的原则如果两首方剂药物组成相同,且各药物用量比例相同,就可以判为相同方剂。使药剂量的少许差异不会导致两首方剂功效、主治的差异,因此仍然能判断为相同方剂,如“姜、草、枣”一类作为“使”药使用时,少许用量差异则忽略不计。 排除重复方剂43首,余268首方剂。,查看原始数据,仲景方数据预处理方剂归类,分别从病性(寒热虚实)、病位(五脏六腑)、六

10、经、出处(伤寒、金匮)等角度对仲景方进行归类,查看原始数据,仲景方数据预处理方剂归类结构化,查看原始数据,格式转换,挖掘的主题张仲景主治寒热证的用药规律数据集成集成“药物组成结构化”&“方剂归类结构化”调整数据分组结构化转换为三元组方式,仲景方配伍规律挖掘,关联规则挖掘分类关联规则挖掘,模式评估,(1)挖掘出的关联规则和分类关联规则可以作为专业领域内已公认知识的佐证。(2)有些模式的价值目前尚不能得到认可,可以通过文献考证、专家认可、临床或试验等来确认模式的有效性。,试验考核内容 3月21日之前交报告,仲景方用药关联规则的挖掘仲景方用药分类关联规则挖掘寒、热、寒热错杂虚、实、虚实错杂,谢谢!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。