1、1基于 GIS 地理空间认知的结核病预防分析与推理研究摘 要:为研究传染性疾病与空间认知的关系,本文以成都市疾病防控中的结核病为主要研究对象,结合有关统计数据,通过应用空间自相关等空间数据分析方法,寻找发病热点区域、空间点分布模式,设计了结核病地理元胞自动机的基础模型,应用此模型模拟了结核病传染过程,分析和推理结果更新了对疾病的空间认知,为疾病防控的科学决策提供了参考依据。 关键词:GIS;空间认知;疾病预防;分析推理 0 引言 在疾病防控中,GIS 的主要作用在于运用空间分析和数据挖掘,进行疾病监测预警分析、发病地区分析、发病原因分析、传染病传播分析、统计分析与可视化等1。陈如桂2等应用医学
2、地理与 GIS 方法分析病情分布时空结构及其与环境及社会经济因素的相关性,在确立对病情定量评估方法的基础上,建立病情动态监测与预报模型,有效防治疾病的发生、流行。尹轶华3等利用 GIS 强大的数据管理分析和显示功能,与医学疾病相结合,搭建疾病信息系统平台,对疾病实施动态监控预测。肺结核病发病有很强的空间性,具有传染疾病聚集性分布的特点,与地区地理信息高度相关4,5。据卫生部结核病控制中心报告,我国自1982 年起进行全国结核病人统计报表,最近 20 余年以来,我国结核病传染源的发现数明显增加。但与流行病调查结果相比较,传染性病人的发2现率不足 30%。在调查中发现的肺结核病人有 54%未曾就医
3、,59%的病人就医于综合医疗机构,而未实行归口管理,这种情况给扼制结核病疫情带来一定困难。成都市自实行 DOTS 策略以来,结防工作取得历史性突破,圆满完成结防十年规划制定的相关目标,取得阶段性成果。在已取得的成果和历史累积的大量数据中,如何发现发病热点区域,揭示空间关联模式,成为结核病发病空间认知的重要内容。文章拟在成都市结核病相关统计的基础上,深度发掘结核病的空间聚集性,展示发病格局,推演发病的时空演进,探讨 GIS 和地理空间推理在疾病防控中的应用。 1 主要理论基础 1.1 地理本体 地理本体是一种领域本体,这类本体描述的词表关系到某一具体的学科领域,提供了某个学科领域中概念的词表以及
4、概念之间的关系,或者该学科领域的重要理论6。作为一种领域本体的地理本体,是基于本体的地理数据框架中的一个层次,在其中可定义诸如公路、铁路、建筑等地理学科的本体概念;另一个层次关注实际的地理数据集,领域本体中的许多概念可能在应用本体具有不同的名称,并存在名称相似而实质不同的情况。 1.2 地理空间认知 地理空间认知研究是地理信息科学的核心内容之一,包括地理事物在地理空间中位置的研究和地理事物本身性质的研究。地理认知研究主要包括地理知觉、地理表象、地理概念化、地理知识的心理表征和地理空间推理,涉及地理知识的获取、存储和使用7。 31.3 地理空间推理 空间推理是人类空间认识世界的一项基本活动。高俊
5、(1997)认为,地理空间知识可以表示为“地理空间关系+语义” ,即地理空间推理就是地理空间关系的推理,它包括了一般的空间推理问题,是从空间知识形式化建模和逻辑推断的角度认识空间。 2 结核病防控中的地理本体构建 2.1 基于 GIS 的结核病防控 GIS 应用于结核病防控的总体目标是利用现代信息技术手段,将单纯的结核病信息与地理位置结合,实现结核病防控中数据分析的多元化,将隐含信息通过可视化的手段挖掘出来,为保障人民健康服务。 结核病防控与 GIS 结合,其信息来源复杂,数据量大,具有综合性。其主要数据有: 2.1.1 基础地理 涉及的基础地理数据有:境界、水系、交通、居民地、医院、经济指标
6、等。 2.1.2 疾病数据 结核病病患个体基础数据:姓名、性别、年龄、详细住址、病情状况等。 2.2 结核病地理本体构建 基于此,特构建如图 1 所示的结核病防控地理本体框架和图 2 所示的结核病人的本体实例。 3 基于 GIS 的结核病分析与推理研究 43.1 结核病防控地理数据组织 GIS 空间数据组织的对象来源于现实世界的地理现象,因此,必须对现实世界进行抽象和表达,以建立现实世界的 GIS 数据模型。本研究基于疾病防控地理本体框架,根据结核病发病的特点,利用层次分析法归纳出空气质量、经济状况、流动人口三个确定易感人群的主要影响要素。对所需数据分类分层,并确定研究所需地理数据及表达方式(
7、表 1) 。 基于此,疾病防控地理数据库采用了 geodatabase 面向对象数据模型。这种数据模型的定义目的在于使得 GIS 数据集中的特征更加智能化,物理数据模型与其逻辑数据模型更加接近8。 3.2 结核病发病的空间自相关性分析 地理空间自相关反映的是一个区域单元上某种地理现象或某一属性值与邻近区域单元上同一现象或属性值的相关程度9。在这个问题的研究上,Moran 首先提出了度量空间自相关的方法 Morans I,目前,几乎所有涉及空间自相关的研究中都如此应用。Morans I 的统计显著性通常采用随机试验方法,一般采用 Z 值检验检验区域间是否存在空间自相关。当 Z 值为正时,表示在地
8、理分布中存在正的空间自相关,这时可以认为空间上是区域化的、集聚的;当 Z 值为负时,表示空间自相关;但 Z 值为零时,观察值属于独立随机分布,认为空间上是独立的、非相关的和随机的。 据此,对成都市 2005 年和 2006 年关于结核病相关统计数据进行计算,根据空间数据的分布可以得到正态 Morans I 的期望与方差,并最终得到标准 Z-值如下: 52005 年活动性病人登记率 Z=0.37122, 2005 年涂阳病人登记率 Z=-0.11666, 2006 年活动性病人登记率 Z=0.38732, 2006 年涂阳病人登记率 Z=-0.09125。 通过空间自相关分析得到不同年份的 Mo
9、rans I 值,可以看到,活动性病人具有明显的空间聚集效应。而作为活动性的一种的涂阳病人在空间上不具有聚集效应。事实上结核病作为一种传染病,除了其传染性外,与该地区地理信息高度相关。 3.3 结核病发病的热点区域分析 Morans I 仅仅使用一个单一的值来反映一定范围内的自相关,很难发现发病的热点地区,即对周围区域发病有重要影响的地区,必须进行局部的空间相关性分析,为此需要计算 Getiss G 统计量,G 值越高,则表示发病情况在该区域附近有某种“扩散效应” ,揭示了结核病发病在该区域附近产生了聚集,即所谓的“热点区域” ,该片区应为重点防控区域。对结核病发病的局部相关分析的 G 值从高
10、到低排列如下: 1)2005 年活动性病人登记率:武侯区、成华区、双流县、青羊区、金牛区、锦江区、郫县、龙泉驿区; 2)2005 年涂阳病人登记率:武侯区、成华区、双流县、金堂县、青白江区、龙泉驿区、锦江区、温江区、金牛区; 3)2006 年活动性病人登记率:武侯区、成华区、双流县、青羊区、郫县、金牛区、锦江区、龙泉驿区; 64)2006 年涂阳病人登记率:武侯区、成华区、双流县、龙泉驿区、温江区、金牛区、郫县、青羊区。 由结核病发病的局部相关分析结果可以得到若干发病热点区域:武侯区、成华区、双流县、青羊区、金牛区、锦江区、郫县、龙泉驿区等。3.4 结核病发病的时空演进 研究中采用基于地理元胞
11、自动机10建立传播模型与历史病情动态模拟模型,模拟结核病传染的时空演进。 根据结核病发病的特点,利用层次分析法归纳出空气质量、经济状况、流动人口三个主要影响要素,对这三个要素进行分级,确定了每个地区的这三个影响要素的级别后进行量化,由量化结果制作栅格图并进行栅格计算,得出每个元胞的影响因素之和,然后根据空间自相关性获取发病热点区域,由以上部分确定元胞被感染的概率 P,进而得出如图 3所示的结核病扩散模拟结果: 4 结束语 地理信息科学中的本体、认知、推理研究涉及方方面面,本文在建立结核病防控地理本体的基础上,以疾病防控作为研究内容,从空间认知基础出发,提出认知需求,寻找解决问题的方法,通过空间
12、分析和推理,获得新的认知,回归认知,获取了结核病发病的空间自相关性以及热点区域与时空演进模式,分析了成都市各个行政区结核病发病的空间自相关性以及热点区域,显示出活动性病人具有明显的空间聚集效应,并分析出发病热点相关区域,为疾病的科学防控提供参考依据。 7参考文献: 1 ESRI 中国(北京)有限公司.ESRI ArcGIS 医疗公共卫生地理信息系统解决方案K. 2 陈如桂,杨林生,王五一.GIS 在卫生与健康领域的应用探索中国鼠疫医学地理信系统的设计与建立J. 地理科学进展, 1999,18(4):368-372. 3 尹轶华,赵纯勇.基于 GIS 的疾病信息系统的研究设计J.西华师范大学学报
13、(自然科学版) ,2004,25(1):99-103. 4 王成科,蒲松常.585 例痰涂片阳性肺结核病例空间聚集性分布探讨J.现代预防医学,1994,21(2):109-110. 5 王红光,王文昌,彭斌等.结核病发病的空间分析J.第三军医大学学报,2006,28(8):859-860. 6 孙小燕.本体理论及其在地质环境管理信息系统中的应用D.南京:南京师范大学,2006. 7 鲁学军,周成虎,龚建华.论地理空间形象思维空间意象的发展J.地理学报,1999,54(5):401-408. 8 Michael Zeiler 著.张晓祥,张峰,姚静等译.为我们的世界建模-ESRI 地理数据库设计指南M.北京:人民邮电出版社,2004. 9 郭庆胜,杜晓初,闫卫阳.地理空间推理M.北京:科学出版社,2006. 10 周成虎,孙战利,谢一春.地理元胞自动机研究M.北京:科学出版社,2001.