1、名老中医电子病历中病史动态结构化数据录入规范作者:张润顺,王映辉,姚乃礼,刘保延,姜在旸,周雪忠,田琳【关键词】 名老中医;电子病历;数据库;规范化研究电子病历(Computer-based patient record,CPR)的结构化是基于信息和数据挖掘技术研究名老中医经验的基础1,结构化中医病历的核心在于病史的结构化,CPR 结构化的方法主要有自然语言处理(NLP)和结构化数据录入(SDE)。笔者就名老中医临床诊疗 CPR 中病史的动态结构化数据录入(Dynamic structured data entry based,DSDE)进行了规范化研究,提出应根据症、证、治、效要素进行结构化
2、录入的原则,制定了选择和增加病史结构化的重要元素病历字段(临床诊疗术语)的规范,确定了选择字段名的原则和方法、字段的赋值方法等,以便形成标准化的临床信息数据,为整理形成数据库、数据仓库,进一步的统计分析和数据挖掘奠定基础。1 动态结构化数据录入是实现名老中医电子病历结构化的可行方法CPR 结构化是指将病历中的知识点按照医学专业要求尽可能地提炼出来,并用规范的医学和专业术语书写表达,转化为蕴含有可分析的数据的结构化病历的过程。CPR 结构化的方法主要有 NLP2和 SDE3-4。NLP的目的是实现从自由文本中自动地提取代码化的医疗数据,其基本优点在于可应用已有的自由文本,临床医生在表达临床发现和
3、作出决策等方面不必改变他们习惯的记录方式,不足之处是不能影响或改善数据获得过程本身,可能有解释错误的危险,所以得出的结论需核查,这一附加步骤需要人的参与。但是叙述性信息经常包含歧义性,它易为人类解决,难以为计算机的算法所解决2。而 SDE 是一个支持由临床医生直接输入的结构化数据采集的模块,SDE 可以为数据输入提供预定义选项,其中蕴涵了临床医生经验和知识的知识库,是获得更完整更确切数据的重要方法。结构化中医 CPR 的核心在于病史的结构化,它是研究名老中医临床证候判别、辨证思维、治疗评价等经验和规律不可缺少的资料,由于它具有信息的叙述性、范围广泛、输入的临床特征不可预料性的特征,NLP 等方
4、法难以解决其结构化,而 DSDE 可根据感兴趣的主题自行调整结构化的内容和形式,则更适用于名老中医临床诊疗信息中病史的结构化。我们设计研制了名老中医临床诊疗信息采集系统(以下简称系统),采用 DSDE的方法,并在长期的使用中不断积累经验,结合大量反馈意见,不断改进和完善,实践证明该方法是可行的。2 DSDE 的规范要求2.1 确定结构化原则 根据症、证、治、效要素结构化病史内容很多,没有必要进行全部结构化,因此,可根据医生的关注情况,动态、灵活有选择地进行结构化,其余内容可以以文本方式记录在病历中。结构化的原则是根据临床医生所关注的症、证、治、效要素进行结构化。同时要做到:病历页面前台文本要保
5、留老中医病历信息;后台结构化信息要能保留前台病历的结构要素,要能读懂病历,了解患者临床信息全貌;结构化时选择的病历字段要与病历中的相关词相同或同义;选词和赋值要尽量规范、精练。病史结构化的内容主要有:疾病的发病情况,如发病时间、发病地点、发病诱因、发病的缓急、发病时表现、疾病发作及缓解时的情况等;主要的诊疗经过,如就诊医院、曾做检查、曾有诊断、曾用治疗及疗效等;就诊时的症状,主要症状除了有定性的描述外,还要有定量的描述,可将相应的评分用标尺确定,其它症状以定性的描述为主;复诊患者的依从情况、四诊变化情况、合并用药情况等。部分病历病史中记录的症状等信息较多,既有发病时的表现,又有疾病发生发展过程
6、中症状的动态变化,还有刻下症等。对于这种情况,应当根据老中医对病史中症状等信息的认识加以区别,如果不分主次,不加区别进行结构化,分析时可能造成一定的干扰。这样的原则,保证了结构化的信息较完整地保留了中医临床医生辨证论治中考虑的主要证候要素及关注的指标,从而保证了对“症(证)-治-效”规律进行挖掘时的可靠性。2.2 选择和增加病历字段(临床诊疗术语)的规范结构化 CPR 是应用病历字段(临床诊疗术语)及其属性值,用连接词进行组合形成语句,进而构成病历。病历字段是病史结构化的基础元素,有如音符,不同的音符组合可以构成特色各异的乐章。系统中的字段应当足够且能够满足临床需要,但已有的研究成果可以提供的
7、临床诊疗术语远远不能满足实际需求,大量的术语必须来源于名老中医临床实践,从其临床记录中提取,因此,首先应制定增加病历字段的规范体例。病历字段由主词副词组成。对症状类病历字段,如咳嗽,应用“咳嗽”这一主词,加入相应的副词,形成的病历字段有咳嗽发病时间、咳嗽持续时间量、咳嗽变化情况、咳嗽变化时间量、咳嗽变化特征、咳嗽诱因、咳嗽发病地点、咳嗽起病形式、咳嗽程度、咳嗽特征、咳嗽频率、咳嗽除外鉴别症状、咳嗽曾有诊断、咳嗽曾用药物类别、咳嗽曾用药物等。描述现病史的一些共同特征的字段有现病史初诊时间、现病史初诊单位、现病史初诊单位级别、现病史治疗效果、现病史病情评价、现病史实验室检查等。描述体温()的字段有
8、:体温、体温最高、体温最低、体温平时;描述血压(mmHg)的字段有:收缩压、收缩压最高、收缩压最低、收缩压平时、舒张压、舒张压最高、舒张压最低、舒张压平时;描述血常规的字段有:RBC(1012/L)、PLT(109/L)、HGB(g/L)、WBC(109/L)等。增加字段时,一般要求分解到最底级的名词,而中医常用的四字表达方式,常常需分解为两个字段,如对“心悸失眠”需分别按心悸及失眠两个字段处理。对每一个字段,均要设定字段类型,主要类型有数值型、文本型、日期型等,在录入编辑时还可以对相应的字段的域的属性的编辑,如根据需要定义为单选、多选、日期、时段、诊断等选择项。如定义为时段选择,则可在域中方
9、便地录入一个数值和一个时间单位如年、月、天、小时等的组合,常用于描述持续时间这样的字段。2.3 选择字段的原则与方法2.3.1 选择“核心词” 在选择字段名时,要以“核心词”作为字段名,如“眼睑浮肿”,一般不选“眼睑”字段,赋值“浮肿”,而应选择“浮肿部位” 、 “浮肿”组合,如录入“无眼睑及双下肢浮肿”,其含义主要在于描述患者不存在浮肿,因此要选择“浮肿”字段,赋值为无,病历显示为“无眼睑及双下肢浮肿”,又如背部发冷,字段名应选择“发冷” 、 “发冷部位”描述,而不宜选择字段“背部”,赋值为“发冷” 。2.3.2 正确处理“宜分不宜合”与“宜合不宜分”的适用原则 中医习惯上常用四个字来描述症
10、状,如心烦不寐、口干喜饮、尿黄便干或二便调和、咳嗽气喘等。这些表现在录入时最好分解为心烦、不寐、口干、喜饮、尿黄或小便黄、大便干、大便正常、小便正常、咳嗽、气喘等。在分析挖掘时可以根据需要加以组合。此外,对于一些临床常用的主词,则宜合不宜分,如腰痛,不能用“疼痛部位”和“疼痛”两个字段来组合表达。2.3.3 避免重复在一次门诊病历中,某一名称的字段只能选择一次,如多次出现与某一主词相关的词,可采用不同的字段来描述。如在一个糖尿病患者的病历中,血糖值可能有发病时、空腹、餐后等多个数值,不能只用“血糖”一个字段,应选用“发病时血糖” 、 “空腹血糖” 、 “餐后 2 h 血糖”等字段来描述。右下腹
11、突发胀痛,可选用“腹痛部位” 、 “腹痛发病缓急” 、 “腹痛性质”等字段来描述。2.3.4 注重保留病历要素 录入时要求前台文本病历保持原貌,反映临床诊疗整个过程的符合正常语言的描述。在结构化过程中,只要保留其病历要素。2.4 病历字段选择及赋值规范2.4.1 主诉字段的选择和赋值 系统中涉及了选用“持续时间量” 、 “变化情况” 、 “变化时间量”,对“持续时间量、变化时间量”一般赋值为“2 年”等,格式要规范,便于计算机统一处理后进行比较。类似“变化情况”的字段,一般赋值为“加重” 、 “减轻”等。然后再进行简单的编辑。如有两个症状,字段要分别写。2.4.2 主要症状、伴随症状和体征字段
12、的选择和赋值 描述主要症状的字段在病历中必须结构化。对于症状字段的赋值方法有以下几种:如有评分,赋具体的分值,病历显示为咳嗽重度等;如该字段消失,则可赋值为“0”,值为“消失”或“无” 。只有症状,没有评分,则赋字段本身的值,如“咳嗽”字段赋值为“咳嗽” 。如无该症状,赋值为“无”,进行简单编辑,病历显示为“无咳嗽” 。在一些特殊的情况下,利用模板会更快捷方便一些,如血压包括“收缩压:mmHg” 、 “舒张压:mmHg”,经编辑可形成“血压:150/90 mmHg”,存为模板,直接引用,既方便又符合临床习惯。考虑到各种检查在不同医院单位可能不同,因此实验室检查结果赋值包括数值及单位。发病时间一
13、般选具体时间。以便将来统计某些疾病的发病时间规律、发病节气特点等。一般不赋值为“12 月前” 。2.4.3 诊疗经过字段的选择和赋值 初诊情况的描述选择“现病史初诊单位” 、 “曾用药物” 、 “现病史治疗效果” 、 “现病史病情评价” 、 “现病史诊疗经过” 、 “现病史自我诊断” 、“现病史自服药物” 、 “自服药物疗效情况”等。2.4.4 维持治疗情况记录字段的选择和赋值 描述维持用药的字段有维持用药时间量、种类、名称、剂量、用法等。2.4.5 精神饮食等的选择和赋值 选用与病史记录意义相同的字段,如精神、饮食、睡眠、大便、小便等字段描述。如疾病主症为大便异常、小便异常或睡眠障碍等,则需
14、对大小便、睡眠等的各个方面做详细的描述。2.4.6 既往史、个人史、家族史、过敏史、婚育史等的字段选择和赋值 选择“既往患病名”等字段,根据患者情况,赋相应的值,根据需要确定结构化的程度。2.4.7 复诊病历字段的选择和赋值 记录患者的依从情况、服药的剂数等。同时详细记录四诊变化:如服药后情况、效果、病情变化、主要症状的变化情况,现有的其它症状,目前的精神、饮食、睡眠、大便、小便等。总之,按照以上录入规范,可形成较为准确、规范的老中医临床信息数据,为后期数据整理节省人力物力,便于形成主题数据仓库,使临床数据直接转化为可用于科学研究、政府决策等需要的结构化数据,为从多维动态角度挖掘分析名老中医经
15、验奠定了基础。【参考文献】1 王映辉,姜在旸,闫英杰,等.基于信息和数据挖掘技术的名老中医临床诊疗经验研究思路J.世界科学技术 中医药现代化,2005,7(1):98105.2 Dick RS, Steen EB, eds. The Computer-based patient record. An essential technology for health careM.Washington DC:National Academy Press,1991 (first ed.) and 1997 (second ed.).3 Baud RH, Rassinoux AM, Scherrer JR. Natural language processing and semantical representation of medical textsJ. Meth Inform Med,1992,31:117125.4 Jolt Roukema, Renske K Los, Sacha E Bleeker, et al. Paper versus computer:feasibility of an electronic medical record in general pediatricsJ.2006,117(1):1521.