1、基于方剂数据挖掘的证候要素间关联规律的研究作者:汤尔群,任廷革,刘晓峰,张帆,孙燕【关键词】 证候要素;数据挖掘;方剂数据库“证候要素”是中医辨证的基本要素,是辨证体系的核心内容1,对“证候要素”的研究是目前辨证论治研究的一个新热点。本研究以古代方剂文献中所蕴含的“证候要素”为研究对象,以“证候要素”间关系的发现为目标,进行数据挖掘,探讨不同证候要素间关联的某些规律。这一实践对辨证论治新体系1的研究有重要意义,可在为中医“证候”深入研究提供历史数据依据的同时,通过对研究结果的评价,探讨这一研究方法对辨证论治体系研究的有效性。目前一些学者研究认为,“证候要素”主要指辨证所需确定的“病位”和“病性
2、”2,其中“病性”是由病因、病机归纳而得。我们沿用这一思路设计出实验研究的方案,即利用方剂数据库的资源,从历史方剂文献的角度,以某些“病位”为观察对象,去发现与其他“病位”及“病因” 、 “病机”间的关联关系。1 方剂数据库简介北京中医药大学研制的古代方剂数据库(以下简称“方剂库”)采用全文解析、主题标引的技术方案,目前已收录 73 种古代中医文献中所有方剂文献,覆盖了历史上绝大部分方书所记载的方剂内容,年代跨度在 2 000 年以上,共计 92 102 条记录。在对方剂文献进行全文收录的基础上,对方剂来源、主治、组成、服用法等 33 项内容进行了解析,且对方剂文献中记载的病名、病因、病位、病
3、机、立法、证候、症状等内容进行了主题标引,并完成了数据高度的结构化存储,为历史文献信息的充分释放创造了条件,实现了对文献中“证候要素”的提取,成为证候要素间关系挖掘的先决条件。这样建设起来的方剂库,实现了多角度的查询功能,加上整套查询逻辑语言的帮助,优先级干预方法的设置,树状结构“主题词表”的利用,二次查询的设计等,使方剂库在同类项目中具有明显的查询优势,可以满足复杂的逻辑查询的需求,明显提高了数据的查检率和准确率。对于查询所得的结果,除了一般的结果显示,还可以对方剂的功效、用药、病名、病因、病机、病位、症状体征等内容进行统计及关联分析,并通过主题词表的结构对统计结果进行类别归纳,从而实现了基
4、于频次和关系的数据挖掘。2 方剂库中证候要素的表述朱氏等3对古今医家所提出的约 120 项“证候要素”概念进行辨析,筛选出 50 项具有共性特征的“证候要素” 。其中,病位证候要素 19 项:心、神(脑)、肺、脾、肝、肾、胃、胆、小肠、大肠、膀胱、胞宫、胸膈、下焦(少腹)、表、半表半里、经络、肌肤、筋骨;病性证候要素 31项:(外)风、寒、暑、湿、(外)燥、火(热)、痰、饮、水停、虫积、食积、脓、气滞、气闭、血瘀、血热、血寒、气虚、气陷、气不固、气脱、血虚、阴虚、亡阴、阳虚、亡阳、精(髓)亏、津(液)伤、阳浮、阳亢、动(内)风。历史方剂文献中对“证候要素”的表达有些与此不同的情况。其中“病位”
5、囊括了上述的 19 项内容,但还有其他内容的记载,如“冲脉” 、“任脉” 、 “三焦” 、 “膜原” 、 “心下” 、 “目”等;“病性”在历史方剂文献中是以“病因”和“病机”的形式存在。3 病位、病因、病机关系的挖掘3.1 实验设计由于方剂库中的“病位”与上述认识基本一致,为了和其他研究的方法有更好的沟通和讨论的基础,该实验设计以上述 19 个“病位”为研究对象,探讨这些病位与其他哪些病位、病因及病机相关,及与哪些病因、病机相关。3.2 实验步骤分别以 19 个“病位”为条件进行查询,得到符合条件的方剂记录;分别以每个“病位”为限定条件,进行“病位” 、 “病因” 、 “病机”的关系分析;提
6、取与该“病位”相关的病位、病因、病机等证候要素的序列,并按降序排列;系统自动完成对提取结果的分类归纳;将实验结果列表表达。3.3 实验结果限于文章的篇幅,选择部分“病位”数据发布如下。见表 1表3。表 1 中相关的“病机”均为类属,每类均含有具体的内容,如“风邪致病”包括“风寒致病” 、 “风热致病” 、 “风热客肺” 、 “风寒袭表”等具体内容。表 2 中病因“六淫”限于篇幅只能归类表示,实际数据是具体细分的,如病位“肝”,六淫病因中以“风邪”为主。病因中的“内邪”指“内风” 、 “内寒”及“痰饮” 、 “瘀血”等病因而言;“五邪”指基于生克关系的虚邪、实邪、贼邪、微邪、正邪等。表 1 与各
7、病位相关的病机序列注:*各病位在方剂库中的出现频次;取降序前 13 位(下同) 表 2 与各病位相关的病因序列4 讨论4.1 验证中医学对证候的学术认识方剂库收集了足够的历史数据,年代跨度在 2 000 年以上,所选择的文献具有较好的分布性和代表性,因此,挖掘的数据结果若与中医学辨证理论认识相符,可以起到验证中医学有关证候的学术认识的作用。从表1 可知,“胃”与“脾”的关系最为密切(同处中焦,为表里脏腑的络属关系),“心”与“肺”的关系密切(同处上焦,有气血相依的君相关系),“肾”与“肝”的关系密切(同处下焦,具木水相生的同源关系)等,这些大多符合中医学对证候的学术认识。4.2 强化中医学对证
8、候的学术认识从表 2 可知,与各病位主要相关病因多为“六淫”,如“心”与六淫中的“热邪” 、 “寒邪” 、 “风邪”等病因最为密切。其中“热”伤心血,“寒”伤心阳,被大家所熟识,但“风邪”对“心”的影响只在一些名家的医案中才可以见到。如刘弼臣治疗小儿病毒性心肌炎,从肺论治,采用疏风通窍法4治疗,方中使用苍耳子、辛夷、薄荷、细辛等疏风、搜风的药物取得疗效。实际上,早在内经中即有关于“心风”的论述,素问风论篇云:“心风之状,多汗恶风,焦绝,善怒吓,赤色,病甚则言不可快,诊在口,其色赤。 ”因此,这些数据结果对强化中医学对证候的学术认识是有提示作用的。4.3 归纳中医学对证候的学术认识以病位“心”挖
9、掘的数据为例。从表 1 可知,与病位“心”相关的主要病位为“肺” 、 “脾” 、 “肾” 、 “胃” 、 “肝”;从表 2 可知,与病位“心”相关的首要病因为“六淫”,六淫中主要是“火邪” 、 “寒邪” 、 “风邪”,其次“心”与“情致伤” 、 “内邪” 、 “劳伤” 、 “食伤”等病因关系密切;从表 3 可知,与病位“心”相关的主要病机为“心伤” 、 “气虚” 、 “风邪致病”、 “寒邪致病” 、 “血瘀”等。对上述每个关系,方剂库都提供了文献依据,再结合中医学辨证理论的认识和现代临床的验案依据,梳理下来即可完成中医学对“心”病辨证的系统认识。因此可以说,挖掘的数据结果为中医辨证学术的归纳、
10、梳理提供了重要的线索。4.4 挖掘方法的启示4.4.1 中医学辨证理论体系研究的新方法 本实验研究是从“病位”这个证候要素切入进行的,完全还可以“病因” 、 “病机”作为切入点进行系统的研究。这样的研究一旦取得成果,无论是对中医历史文献信息的释放,还是对中医辨证理论体系的研究,无疑都是具有划时代意义的工程。4.4.2 数据完整性是影响挖掘技术运用的主要因素 由于历史原因,要实现方剂库数据的“完整性”还有相当的距离,如上述表中的“频次”,是基于当前文献直接表达的文义,就“病因”而言,任一病证不会没有“病因”,而历史方剂文献的记载状况则是有的有记载,有的没有记载,即数据缺乏完整性。因此,完成方剂库数据完整性建设是一项工作量很大的艰巨任务。就目前的技术现状而言,我们对数据完整性建设的需求,远远超出了对数据挖掘技术的期待,因为数据完整性是影响挖掘技术运用的主要因素。【参考文献】1 朱文锋.创立以证素为核心的辨证新体系J.湖南中医学院学报,2004, 24(6):38-39.2 朱文锋.中医辨证体系及“证”的规范化研究J.天津中医,2002, 19(5):1.3 朱文锋,晏峻峰.证素辨证新体系的内容及科学意义J.医学与哲学, 2005,26(1):69.4 刘弼臣.刘弼臣临床经验辑要M.北京:中国医药科技出版社,2002.322.