1、基于关联数据的神经功能重建实验数据管理方法与应用摘 要“神经功能重建”应用定向神经移植术(Targeted Reinnervation,TR)重建运动与感知功能,对肢体残疾人士生活质量的改善有着重大意义。根据目前已实施的 TR 手术,虽然理论模型和动物模型基本一致,但是涉及到的残肢状况、神经接口、康复训练也表现出明显的个体差异。本研究以定向神经移植术的典型代表目标肌肉神经移植术(Targeted muscle reinnervation,TMR)为切入点,把 TMR 实验的数据规范采集、数据组织、可扩展数据模型、数据检索处理方式作为研究内容,提出了基于关联数据(Linked Data,LD)的
2、神经功能重建实验数据管理方法。该方法包含两个部分:基于关联数据的神经功能重建实验知识模型设计和关联数据检索处理。前者包括设计实验信息清单、构建实验本体、基于 RDF 形式化描述实验本体。后者解决关联数据资源的准确检索与展示。依据本方法,设计出 TMR 实验信息清单、本体、关联数据模型。本研究为 TR 手术建立了以本体为基础的知识模型,填补了 NIF 在神经功能重建领域的信息缺失。关键词:神经功能重建,实验数据管理,目标肌肉神经移植,本体,关联数据1 引 言神经功能重建分为感知觉重建、运动功能重建,实现感知觉和运动神经信息源的生物增强或重建;通过多元神经信号融合分析及互适应学习机制研究,建立感觉
3、神经信息与感知觉之间、运动神经信息与运动功能之间的对应关系,实现神经与机器的有机融合。在残疾人康复、老年人护理、军事、人工智能、娱乐等方面具有广阔的应用前景。神经功能重建应用定向神经移植术(Targeted Reinnervation,TR ) 1,实现肢体感知觉信号的再生与肢体运动功能的恢复,能使一个被截肢者控制电动假肢设备和重新获得感觉反馈。TR 包含两种主要技术:目标肌肉神经移植术1(Targeted Muscle Reinnervation,TMR) 、目标感觉神经移植术(Targeted Sensory Reinnervation,TSR) 。TMR 需要选择被截肢者身体上一个部位的
4、肌肉,作为神经移植的目标肌肉,然后把这肌肉去除原有的神经,最后把残肢上剩余的神经移植到这肌肉上。这样,残肢上被移植的神经能够在目标肌肉上合成肌电信号,通过这信号把运动指令传递到电动假肢,从而控制电动假肢的运动,实现运动功能重建。TSR 需要把覆盖目标肌肉的皮肤去除神经,然后把残肢神经的传入纤维移植到这一皮肤上。当目标肌肉的皮肤被触动时,电动假肢也会产生一种被触动的感觉,实现感知觉功能重建。神经功能重建技术若要广泛应用到现实生活,则需要熟练掌握这种技术的操作流程,以及能应对各种异常处理。目前国内正在进行对猴子、白鼠的 TMR实验,国外已经尝试对人进行 TMR 实验,得到了初步的成功。根据不同的伤
5、残情况,实验的设计又可分更细的类别。每一种实验设计在理论模型、动物模型、动物实验、神经接口、康复训练上各具特征。因此,TMR、TSR 还需要进行足够的实验、积累数据、总结经验、完善理论基础,才能更好地指导现实应用。TMR 实验作为神经功能重建实验的典型代表,属于典型的生物神经工程领域实验。一般而言,其产生的数据有多模、静态、动态、衍生、多重相关性等特点。面对海量、异构、高度复杂的实验数据,提高数据的互操作能力,提供一个开放的实验数据管理平台,促进实验成果更广泛、方便地共享,挖掘更多的关联信息,成为了迫切的需求。神经信息学 2与生物学实验数据管理 2的研究成果,提供了满足此需求的一个开放概念平台
6、。神经信息学是通过使用计算机模型和分析工具,把神经学的数据加以组织的研究领域。对于增长的大容量、高维度、和细粒度的实验数据集成都非常有意义,而且还为临床医生和科研人员提供计算工具、数学模型、以及生成可互操作的数据库。其中的神经科学信息框架(NIF) 3是一个动态的神经科学数据库的仓储,其核心本体 NIFSTD,是一个模块化词汇表,涵盖了神1 Targeted reinnervation,http:/en.wikipedia.org/wiki/Targeted_reinnervation2 Neuroinformatics,http:/en.wikipedia.org/wiki/Neuroinf
7、ormatics经科学主要领域的分散模块知识:功能和功能障碍、解剖、细胞、亚细胞、分子。生物学实验数据管理,相关研究者在实验数据的采集、组织、发布等方面提供了参考规范。TR 实验主要针对肢体残疾,有基于生物学实验、信息技术集成的特点,符合 NIF 与生物学实验数据管理的内容,并且目前该领域的知识描述还是一块空白。2 基 于 关 联 数 据 的 神 经 功 能 重 建 实 验 数 据 管 理 方 法本文以提供神经功能重建实验数据的便利共享、提高实验数据管理的互操作能力为目标,集成实验最少信息标准、基于本体的数据管理理论 45、关联数据理论的相关成果,提出基于关联数据的神经功能重建实验数据管理方法
8、。2.1 基于关联数据的神经功能重建实验数据管理方法框架该方法框架包含两个部分:基于关联数据的实验知识模型设计、关联数据检索处理。该方法框架如图 2-1:基于关联数据的实验知识模型设计 关联数据检索处理数据采集层 逻辑组织层 形式化描述层目的 : 规范的数据采集 设计实验信息清单目的 : 有共享概念的数据组织构建实验本体目的 : 有良好可扩展性的数据模型基于 R D F 形式化描述实验本体用户需求层目的 : 使用共同的数据交换语法基于 S p a r q l 的关联数据检索处理图 2-1 基于关联数据的神经功能重建实验数据管理方法框架 第一部分分为如下三个阶段:首先,设计实验信息清单,作为在实
9、验数据采集阶段的记录模型,用来收集实验的关键元素。然后,构建实验本体,作为实验知识模型的逻辑结构。对采集到的数据进行组织,充分挖掘数据资源的关联,形成一个相互联系的整体,为数据管理打下结构化基础。最后,基于 RDF 形式化描述实验本体,实现本实验知识与外界数据集的关联。第二部分以 Sparql 的检索机制为基础,结合用户的需求,对实验关联数据的检索进行处理,帮助用户更好地发现实验的关联知识。2.2 节到 2.4 节分别详细描述第一部分三个阶段的内容要点,2.5 节详细描述第二部分的内容要点。2.1 基 于 最 少 信 息 标 准 的 神 经 功 能 重 建 实 验 数 据 采 集MIBBI 提
10、出的生物学实验最少信息清单 6,就是基于最少信息标准的实验数据规范采集解决方案,但仍缺乏神经功能重建领域具体信息的描述,本节将探讨神经功能重建实验信息清单的设计要点。生物学实验成果要实现不断的积累、降低信息内容的不一致性、促进更大范围的信息共享,那么就要做到实验数据规范采集与发布。实验最少信息标准 3,是生物科学领域用来发表实验数据的指导原则 7。遵从这些原则发布实验数据,不仅可以使得数据便利地被科学界验证、分析与明确解释,还可以促进结构化的基础数据库、公共存储库和数据分析工具的开发。根据这些数据标准,可以为实验数据采集的质量提供了一个指导思想。为了达到这些标准,MIBBI 项目提出了生物学实
11、验最少信息清单的概念:一个规范的信息发布框架,能够捕获一个实验的关键信息、以及解决生物学实验数据采集的不一致性问题,促进更广泛的实验信息共享。虽然 MIBBI 项目没有直接可以使用的神经功能重建实验最少信息清单相关内容,但可以参考其描述一个实验的基本元素,并结合神经功能重建实验的特征,提出实验信息的发布参考规范,指导信息清单的设计,构建数据采集模型。该规范遵循两个基本的原则:重用当前 MIBBI 项目实验信息清单中的基本元素;加入针对神经功能重建实验的特有元素。第一个原则要求先重用目前已经使用的实验基本信息元素,因为这些元素是遵守实验最少信息标准提炼出来的,已经被证明能正确地描述一个实验,并成
12、为各个实验信息描述的共同标准。元素重用,既可以准确描述当前实验,又利于与其它实验进行信息共享。3 Minimum Information Standards ,http:/en.wikipedia.org/wiki/Minimum_Information_Standards第二个原则要求在重用现有实验元素描述当前实验的同时,加入神经功能重建实验特有的元素。不同类型的实验,都会存在自身的信息特性,因此除了享有共同的信息描述元素之外,还存在特有信息元素,这就需要根据具体实验加入相应的元素。根据这两个基本原则,神经功能重建实验信息可分为两大部分:基本信息、特有信息。因此,神经功能重建实验信息清单可设
13、计成两个部分:基本信息清单、特有信息清单。如图 2-2:设计神经功能重建实验信息清单设计基本信息清单 设计特有信息清单采集 : 基本信息 采集 : 特有信息图 2-2 神经功能重建实验信息清单设计流程2.2 基 于 本 体 的 神 经 功 能 重 建 实 验 数 据 组 织本体(Ontology)的定义源于哲学 8,在计算机学科中的应用主要体现在领域知识管理和大系统的设计。本体的构建虽然已经出现了各式各样的方法,但在实际应用中,对于某一特定的应用,还需探讨适合自身的构建方法,本文根据分析神经功能重建实验的特性,在对传统本体构建方法进行取长补短的基础上,设计基于逐层扩展的神经功能重建实验本体构建
14、流程。神经功能重建实验本体建立,目的是对信息清单采集数据资源在概念层次进行组织,整合各类数据资源,使得经过组织的内容能够拥有丰富的语义关系,为关联数据模型的建立提供一个逻辑框架。本文对传统的本体构建方法进行取长补短,针对神经功能重建实验的特点,采用的本体构建思想:在坚持传统本体构建基本原则的基础上,加强与领域专家的交流,结合迭代改进的思想,由构建一个由共享概念组成的顶层本体开始,逐步加入神经功能重建实验核心概念,同时不断反复验证本体的合理性,进一步修改完善,直至满足应用需求。构建流程如图 2-4:核心本体构建顶层本体构建创建顶层类在神经功能重建实验领域的子类 ( 核心类 )创建核心类的属性及约
15、束创建核心类的实例本体验证领域专家验证基本原则验证在共享本体术语中查找每模块信息的类属概念 , 作为顶层类为剩余模块新建顶层类属概念为实验信息清单内容划分模块所有模块是否已有顶层类 否是创建顶层类的对象属性迭代验证术语搜集有权威的共享本体术语领域术语迭代验证图 2-4 神经功能重建实验本体构建流程该流程由四大执行模块构成:术语搜集、顶层本体构建、核心本体构建、本体验证。分述如下:首先进行术语收集,为本体构建提供术语素材。需要从两个方面进行搜集:领域术语、权威本体共享术语。由于神经功能重建实验信息清单是经过实验现场观察分析、与领域专家交流、并复用生物学实验基本信息元素建立的,其内容基本覆盖该领域
16、实验的核心,所以可以根据分析清单的内容,提取本体的核心术语。然后进行顶层本体构建,负责描述神经功能重建实验的最抽象知识。顶层本体的目标要提供一个既有良好可扩展性能,又能全面覆盖实验基本元素的初始本体,那么,组成顶层本体的概念的抽象等级必须尽可能高,并且设计尽可能简单,能够描述出实验的基本元素及关系即可。为了促进实验信息的知识共享,顶层类采用借用本体共享概念为先、创建新概念为辅的构建思想。为了能够描述实验基本抽象语义知识的同时,又能根据应用需求描述新知识,顶层类的对象属性设计需要分为两部分:第一部分设计顶层类的客观关联,描述本体的基本知识;第二部分设计顶层类的应用关联,以适应需求的变化。形成初始
17、顶层本体后,需要进行两个方面的本体验证:领域专家验证,基本原则验证。前者需要通过反复的交流探讨,验证领域术语采集的完整性与准确性,并把空缺的术语进行填补。后者使用本体构建的基本原则进行验证。反复进行这样的交流验证与改进,把验证的结果改进顶层本体,直至顶层本体满足需求。最后进行核心本体构建,负责描述实验的核心内容,实现神经功能重建实验特有部分本体的构建。核心本体概念的定义既要基于顶层本体的概念,又要基于实验信息清单的内容。最后进行如前所述的本体验证,把验证的结果改进核心本体,反复进行这样的交流验证与改进,直至核心本体满足需求。经历以上步骤后,神经功能重建实验本体基本形成,但是为了跟进实验及理论知
18、识的发展,需要分周期对本体进行验证,推进本体的演进。2.3 基 于 RDF 的 神 经 功 能 重 建 实 验 数 据 形 式 化本文采用资源描述框架 9对神经功能重建实验本体进行形式化表达,构建关联数据模型。关联数据是指在Web上发布与关联结构化的数据 10。Tim Berners-Lee11介绍了关联数据的基本原理,包括:使用URI作为事物的名字;使用HTTP URI以使人们能够查找URI形式的名字;当查找一个URI的时候,要使用相关标准,如RDF、SPARQL查询语言 12,以获得有用的信息;指向其他URIs的链接,以便发现更多的事物。根据关联数据原理的分析,本文提出基于 RDF 的神经
19、功能重建实验关联数据模型设计流程:初选目标数据集筛 选目标数据集选取 U R I创建本地 U R I建立 R D F 模型描述开始结束图 2-5 基于 RDF 的神经功能重建实验关联数据模型设计流程初选目标数据集,为实验数据的关联目标提供一个范围。关联数据意在全球范围建立一个包含共享概念资源的数据空间,使用 RDF 连接进行关联共享。目前出现了一些大家共识的共享概念,但某些概念同时存在不同的数据集,且使用不同的 URI 进行标识。由于神经功能重建实验本体采用了共享的本体概念,那么可以找到包含这些共享概念的数据集合,作为初选的目标数据集。筛选目标数据集,定位实验数据的关联方向。为了让实验信息能够
20、被广大研究人员共享,那么就应该要把实验数据关联到已经被广泛共享的数据集。这里提出数据集的筛选原则:以高数据价值为导向,价值可以体现在该数据是否已被广泛共享;争取数据增值,考虑两个数据集中知识的融合,是否有产生新知识的可能;要求目标数据集拥有稳定的命名空间,这可为关联数据空间提供一个稳定的环境,有利于知识随着共享范围的扩展而得到积累;要求数据集拥有稳定的 URI,能够让神经功能重建实验数据与目标数据集得到稳定关联。选取目标数据集的 URI,需要在筛选出的目标数据集里面,查找到所有与本实验相关的概念的 URI,标识实验共享概念。创建本地 URI,首先需要创建本地命名空间,然后在该命名空间下创建HT
21、TP URI,标识核心本体概念,如标识实验的人员、仪器、药品等实体,标识实验的环节、方法等抽象概念。建立 RDF 模型描述,使用 RDF 形式化描述实验本体,构建一个具有良好可扩展能力的数据模型,以适应知识的积累。2.4 基 于 SPARQL 的 关 联 数 据 检 索 处 理如前所述,资源描述框架是 W3C 推荐的元数据模型描述规范,作为一个概念描述的一般方法。Sparql 就是通过查找 RDF 三元组匹配的数据抓取机制,原理如下:SELECT ?namevalue WHERE ?person name ?namevalue. ?person friened .“WHERE”里面的每一条带有
22、变量三元组都是一个搜索条件,以上语句会把数据空间的所有三元组与(?Person,name,?namevalue) 、(?Person,friened,)进行匹配,当一个作为主语的资源同时满足所有的搜索条件,就可以把这个主语及其相关的信息资源抓取出来。这种检索方式面向整个数据空间,所以能把所有满足条件的资源及相关的资源都抓取出来。虽然这种方式检索出的数据资源是全面的,但是也存在大量的、无序的特点,所以需要对关联数据检索进行处理,为知识的发现提供方向。本文针对的是神经功能重建实验及其相关数据资源的检索,要求能够从多个角度检索一个实验,例如根据负责人的名字或实验对象的名字检索一个实验,这就需要对关联
23、数据检索进行条件约束处理。在一个三元组中,如果把主语、谓语、宾语的一个或多个设置成变量的时候,看成一个条件搜索单元,那么就一共有 7 种类型的条件搜索单元。根据应用的需要,这 7 种类型的条件搜索单元可以自由进行交组合、或组合,可以形成丰富多样的条件搜索单元组合。当检索出一个实验的时候,这个实验的相关数据资源可以通过 RDF 关联进行获取,此时需要根据用户的需求把相关的数据资源进行分块展示,为用户提供一个友好的信息导航服务。据以上分析,本文采用的关联数据检索处理流程如图 2-6:开始结束分析用户检索需求设计基于 R D F 的条件搜索单元组合编写 S p a r q l 语句进行搜索根据用户需
24、求进行数据分块展示图 2-6 基于 Sparql 的关联数据检索处理流程分析用户检索需求,需要对用户查找一个实验的角度进行分类,如依据负责人查找或依据日期查找等。然后为每个查找角度设计基于 RDF 的条件搜索单元,并把这些单元组合成搜索条件。接着编写 Sparql 语句进行搜索,最后把搜索结果根据用户的需求进行分块展示。3 基于关联数据的 TMR 实验知识模型设计依据第二章所提方法的第一部分内容,以神经功能重建领域的典型代表TMR 实验为例,本章设计基于关联数据的 TMR 实验知识模型,经过三个阶段:设计实验信息清单、构建实验本体、设计基于 RDF 的关联数据模型。3.1 基 于 最 少 信
25、息 标 准 的 TMR 实 验 信 息 清 单依据本文提出的神经功能重建实验信息清单设计原则,TMR 实验信息清单由两部分构成:基本信息清单、特有信息清单。根据对生物学实验构成元素的总结,抽取出 TMR 实验的基本信息元素,包括实验目的、类别、人员、对象、配置、环境等。整个实验先后要经过 TMR 动物模型建立、TMR 动物模型康复、TMR 模型肌电数据采集、TMR 模型肌电分析这四个过程。每个过程都由一系列操作环节构成,每个操作环节又包含两大类信息:固有信息、实施信息。基于此分析,TMR 实验特有信息的采集与该分步过程对应。(1)TMR 动物模型建立信息清单该部分为手术程序部分,信息清单由一系
26、列操作环节及相关信息元素构成,其操作环节结构框架如表 3-1 所示:表 3-1 TMR 生物模型建立的环节组成大环节 中环节 小环节客体准备 禁食、固定、脱毛、体液维持、麻醉、血压与呼吸监测主体准备 着装准备、手臂消毒术前准备配置准备 人员准备、器械准备、药品准备备皮 区域消毒、切口准备、手术铺单供体神经探查切口、依次探查各神经(分离组织筋膜、探查臂丛神经与血管的分布)目标肌肉及支配神经探查 皮肤与筋膜分离、肌层分离、支配神经探查与分离供体神经移植 目标肌肉支配神经离断、神经移植术(神经阻滞、神经离断、神经移植)术中处理缝皮客体处理 手术野消毒、术后监护主体处理术后处理配置处理 药品归类、器械整理、手术台清理表 3-1 所示的手术程序各个环节都需要描述的固有信息包括目的、可用方法、可用配置、质量控制措施,这些信息来源于与领域专家的交流。各环节对应描述的实施信息,来源于实验现场的观察分析以及与领域专家的交流,其组