1、GIS 空间分析Spatial Analysis of GIS张洪岩中国东北资源与环境研究吉林省高等学校重点实验室2009 年 9 月第一章 GIS 空间分析概说GIS 技术的发展已经超过了 30 年。多数人认为,GIS 的功能用于制图;GIS 还可以用于分析: 事物分布的原因,以及事物之间的空间关系。 获得更为精确、时势(up-to-date)的信息,甚至建立新的信息。本章将主要学习: 什么是 GIS 分析? GIS 空间分析的主要方法 GIS 分析的主要过程1.1 什么是 GIS 分析?GIS 分析是人们发现地理数据的分布格局(geographic patterns)和要素(feature
2、s)之间关系(relationships)的过程。 其结果将有助于了解当地的特点,采取合理的行动,作出最优的决策。方法(Methods ) 地图(Maps) 模型(models)多个数据图层的结合。GIS 分析的目标 获得对某一地方更为深入的了解;作出最佳的决策;为未来的规划作好准备和创造条件。为什么应用 GIS 进行分析的人不多?GIS 的应用只是在近年来才得到较为广泛的应用,对许多人仍很陌生。采用 GIS 进行分析还比较困难。多数人还不知道,除了制图和创建报告之外,GIS 还能够作什么。1.2 GIS 空间分析的数据 表达地理现象的两种途径: 矢量 Vector每个要素是表格中的一行;要素
3、的形状由空间中 x,y 坐标定义; 位置、线、面或事件 栅格 Raster要素表现为在一个连续空间中的单元矩阵(matrix of cells) ;每个图层表示为属性;单元大小将影响到分析的结果和地图的形式;原始地图的比例尺决定了单元大小。 认识地理要素(Geographic Features)要素的类型 Types of features认识地理属性(Geographic Attributes)属性值的类型 Types of attribute values 种类 Categories 排序 Ranks 个数 Counts 数量 Amounts 比率 Ratios 比率表示每个要素两种数量之
4、间的关系,由两者相除来获得。比例和密度 proportions & densities1.3 GIS 空间分析的主要方法 矢量数据分析 栅格数据分析 三维空间分析 空间统计分析与内插 矢量数据分析方法 矢量数据的包含分析 确定要素之间是否存在直接的联系,即点、线、面之间是否存在空间位置上的联系。 矢量数据的缓冲区分析 根据数据库的点、线、面实体,自动建立其周围一定宽度范围内的缓冲多边形实体。 多边形叠置分析 指同一地区、同一比例尺的两组或多组多边形要素的数据文件进行叠置,产生具有多重属性的新多边形。泰森多边形分析 将所有气象点连接成三角形,以各边垂直平分线围成泰森多边形。其内只含一个离散点数据
5、;内部点到相应离散点的距离最近;边上的点到两侧离散点的距离相等。矢量数据的网络分析 其基本思想是人类活动总是趋向于按一定目标选择达到最佳效果的空间位置。 首先要建立网络路径的拓扑关系和路径信息属性数据库。即要知道路径在网络中如何分布和经过每段路径需要的成本值。 方式有选择最佳路径、最佳布局中心以及网络流分析。栅格数据分析的模式 栅格数据的聚类、聚合分析 将一个单一层面的栅格数据系统经某种变换而得到一个具有新含义的栅格数据系统的数据处理过程。亦称栅格数据的单层面派生处理法。 栅格数据聚类是根据设定的聚类条件对原有数据系统进行有选择的信息提取而建立新的栅格数据。 栅格数据的聚合是根据空间分辨率和分
6、类表,进行数据类型的合并或转换,以实现空间地域的兼并。 栅格数据的统计与量算 通过统计分析了解栅格数据的整体特征和态势,包括最大/最小值、均值、中值、总和、方差、频数、众数、范围等参数。 栅格数据的复合分析 同地区多层面空间信息的自动复合叠置。其中各层面信息关系模式的建立对分析工作的完成及分析质量的优劣具决定性作用。 栅格数据的追踪分析 对特定栅格数据系统由某一个或多个起点,按照一定的线索追踪目标或追踪提取轨迹信息。 栅格数据的窗口分析 地学信息在空间上存在着一定的关联性。窗口分析是指对于栅格数据系统中的一个或多个栅格点或全部数据,开辟一个有固定分析半径的分析窗口,并在该窗口中进行极值、均值等
7、统计计算,或与其它层面的信息进行复合分析,以实现栅格数据的水平方向的扩展分析。分析窗口有:矩形、圆形、环形和扇形。三维空间分析 矢量三维分析主要基于数学分析和图论的思想。 栅格三维分析主要以矩阵理论为基础。 三维空间分析对空间对象的位置坐标和垂直坐标进行分析。 二维和三维的本质区别在于数据的分布范围,三维增加了垂直坐标的信息。 目前的三维空间分析主要包括对空间实体的三维显示、查询,坡度、坡向、地标粗糙度、地表复杂度、地表曲率等地形属性的计算和提取。 上述功能可应用到其它领域。 地形的三维显示与分析 空间统计分析与插值 空间统计分析的目的是找出某种属性分布的整体特征和趋势,了解其中的规律,以便对
8、其进行科学的分析和预测。 地学现象、过程和事件多具有一定的随机性。 空间统计方法以概率论与数理统计为基础,适合于对各种随机现象、随机过程和随机事件的处理。 空间统计方法主要用于空间数据的分类与综合评价,包括相关性分析、回归分析、时间序列分析、系统聚类分析、主成分分析、马尔科夫预测、克里格估值法等。空间统计的表现形式有列表、直方图、云图、回归曲线等。 空间统计分析除了能分析数据的整体态势外,还可以分析空间数据采样的合理性。通过分析样区内数据位置和取值的分布,统计该采样数据是否具有对样区某属性的代表性,以及基于此数据的分析是否具有较高的可信度。 插值是根据已知采样点的信息对附近未知点的属性进行预测
9、或估算。 内插是在已存在观测点的区域范围之内估算未观测点的特征值的过程。 外插(推估)是在已存在观测点的区域范围之外估计未观测点的特征值的过程。 常用插值方法有:反距离加权法、样条法和克里格法。内插生成表面ArcGIS 所包含的分析模块1.4 GIS 分析的过程确定问题 制定标准 收集需要的数据 制定分析方案 准备分析数据 执行分析操作 验证并提交分析结果GIS 分析可以是非常简单的过程 Getting specific 分析的前三步非常关键:必须要明确所分析的问题、制定指导分析的标准、找到所需要的数据。明确问题 明确在特定项目中所要调查的问题并非易事。应该通过一两句话描述清楚所要分析的范畴。
10、如果提出的问题很广,就需要将其分解为若干小部分,以便于 GIS 逐个分析 例如,针对“海滩的哪部分受到飓风的危害?”这个问题就可以分三部分进行分析:海滩的哪些部分侵蚀率较高?海滩的哪些部分在城市开发中未得到保护?海滩的哪些部分既有高侵蚀率,又未得到保护?重要的是要务必清楚,一个 GIS 的分析不是解决一个问题,而是利用数据推到信息,即分析的结果。 之后,才会有人或团队利用这些信息制定决策,以期解决问题。制定标准 明确问题之后,就需要确定用于特定距离、量测或属性的标准 。例如,前述当中有关海滩侵蚀何为高侵蚀率?2 英尺/年,还是 5 英尺/年?答案将依赖于分析的目标、所采取的科学方法或可用到的数
11、据。Identify the data 需要什么要素类和属性可以发现满足标准的要素和区位?为了调查海滩侵蚀问题,需要可获得海滩侵蚀率和其它观测值等属性的观测站和城市面积及规划分区等数据。当收集分析数据时,也需要考虑和列出研究方向或分析结果的表达,如:海岸线图层。对于收集的每个数据集,需要调查确认其元数据,如:数据来源、目的、任务、坐标系统和属性描述等。分析的谋划和准备 一旦明确了分析的问题,获得了所需要的数据,就应该花费一定的时间做分析的谋划和准备。Plan the analysis 制订一项分析方案不论如何都是一个明智之举。 有了分析方案可以在实际分析过程中避免失误,节省时间。判断是否需要额
12、外的数据,这在谋划和收集数据阶段需要反复多次。或许还要测试某一特定方法或工具,以确认它能够完成目标,或 掌握其使用方法。图解法是有效的组织和制定分析方案的途径。图解的连贯性要比其格式或形式更重要,图解的流程应该具备:分析数据的准备 因为数据不可能完全满足分析的要求,因此,需要判断准备数据所需要的步骤。例如,为表格添加字段、编辑或更新要素、改正数据错误、定义或改变坐标系统。这些最好在进行分析之前首先完成。分析数据和表达结果 在完成数据准备之后,就要准备进行分析,并观察它所提供的信息是什么。进行分析 如果谋划的过程很彻底,则执行分析应该很容易。按照流程图的中的步骤即可。利用备份的数据进行分析不失为
13、一种好方法。这样,有了备份就可以随时按照需要复原。保存好备份很重要,因为分析可能包括了改变原始要素类、表或数据库的过程,如:组合要素类、计算新的属性值、添加或消除要素等。 检验和表达结果 GIS 分析并非一下子就会产生所期望的结果。这是一个迭代过程随着通过每个步骤,都可能要改变所采用的标准、工具或处理的顺序。还需要花时间证实结果,并通过中间步骤和最终的分析直观分析所生成的数据。验证结果时应考虑:结果是否为所期望的?所执行的过程是否工作正确?除了验证结果,还要结合原始分析目标评价结果。例如,结果是否回答了所提出的地理问题?这个新的信息是有效或有用的吗?最后,分析结果会推动特殊的决定或行动。或提出
14、新的问题来推动更进一步的分析。练习 1:确定问题与选择分析数据 对 GIS 分析的需求来自于那些包括了地理成分的特殊场合或问题。本练习将创造一个开发 GIS 分析的情景。要求学生判断出所要解决的问题,提出采用的标准、收集所要的数据。下一个练习将谋划和执行分析过程,并检验结果。提出问题与获得答案 当 GIS 分析只涉及到数据可视化,以辨别格局和关系,有时甚至是观察地图都不能满足要求时,就需要发现可以同给定标准相匹配的要素。这些可以通过对 GIS 数据库的查询或提问来完成。问题的答案就是所选中的要素集。 有两种 GIS 查询:属性查询和位置查询 在属性查询中,可以选择满足某一特定标准的一个或多个属
15、性。例如,在拥有人口属性的城市图层中查找所有人口超过 100 万的城市。 在位置查询中,可以选择位置满足某些特定条件的要素,通常与其它要素相关联。例如,如果有一个城市图层和主要高速公路图层,就可以选择那些距离高速公路 50 公里之内的所有城市。 一旦选择了要素,就可以对它们进行操作。例如,对它们进行缩放等操作。所选中的数据集是临时的,但可以保存为分离的图层,或导出为一个要素类。基于属性查找要素利用查询表达式可以找到满足特定属性标准的要素。查询表达式是一个包括三部分的逻辑陈述:字段名称(属性) 、运算符和属性值。它通过连接可以形成包含多重标准的组合表达。查询结果是图层中的选中要素集。要素在地图上
16、被选中,同时图层属性表中相应的记录也被选中。在确定性查询这种特殊的属性查询中,查询表达式是该图层的特征,它定义了要素类中的哪些要素将包含在该图层中。确定性查询是一种从地图显示中剔除不感兴趣的要素的途径,同时也节省了图层查询或其它 GIS 操作中的处理时间。通过位置查找要素 与通过属性查找要素一样,利用查询表达可以找到位置满足某一标准的要素。但是,位置查询是一种描述性的陈述。与属性查询一样,位置查询包括三部分:一个目标图层(“select from”) 、一种空间关系和一个空间相关图层。基于同一图层中或不同图层间要素之间的空间关系可以创建位置查询,并可以选择多种不同的空间关系。主要有四类空间关系
17、:距离、包含、相交和相邻。对选中的要素集进行操作因为多数分析都涉及选择满足特定标准的要素,属性和位置查询是 GIS 分析中最常见的操作。下面是选择要素集常见的实例: 在地图中直观分析选中要素的地理分布; 概括或计算选中要素的属性值; 围绕选中要素建立缓冲区; 编辑选中的要素; 生成包含选中要素属性的报告; 将选中的要素保存为可以独立显示和符号化的新图层; 将选中要素导出为在其它地图文件中可使用的新要素类,与他人共享,或在其它 GIS 操作中作为输入来使用。属性查询和位置查询经常混合使用。在某些情况下,尤其是在所查找的要素需要满足一系列标准时,要用到一系列的查询。这里既可以用加法,通过每次查询将
18、要素添加到选中的数据集中,也可以用减法,通过每次查询将要素从选中的数据集中去掉。采用何种方法依标准而定。总体上以处理过程尽量省时为原则。访问更多的属性 并非所有要素属性都保存在图层属性表中。在许多 GIS 数据库中,用户定义的属性(相对于软件生成的属性)被保存在分离的非空间表中。 当要基于属性查找要素时,在查询前有时需要将非空间表与图层属性表建立连接。只要两者共同享有相同字段即可,即该字段下要保存相同的数据。共享字段可以不同名,但类型必须相同(如:文本型、短整型等) 。 练习 2 进行一项 GIS 分析 在上个练习当中,一个房地产经纪人为找到 Garcia 夫妇可能的住宅制定了标准,并收集了相
19、关数据。现在需要考虑一个分析的流程,这既是一个简单方案,也是一个完整的开发流程图解。学生将按这个图解来进行分析。完成本练习后,学生在处理类似问题时将具备较好的方法。考虑一种分析方法 通常筹划 GIS 分析最简单的途径是用简洁的词汇记下所考虑到的步骤。通过逻辑推理,评价将要采用的方法。 回顾前面的分析标准 所要解决的问题是:哪里有满足 Garcia 家标准的住房? 下列列出了你所需要考虑的标准: 待售住房 独户住房 3 个以上的卧室 1990 年 1 月 1 日后建成 售价在$175,000-$225,000 之间 在 Melvin 小学或 Arnie 小学学区内 距离 Terry 运动公园 1
20、 英里范围内 本例中,我们可以利用通过属性查找要素的 GIS 功能。 可以按照下列任务开始: 找出具有期望属性(售况、类型、卧室、房龄、价格)的所有住房。 然后利用位置查找要素的功能进一步提取“在首选学校校区范围内的那些住房 ”。 这种分析方法可用下面的图解表示。 其中,可以保存为中间选中的住房要素集的各项任务包括要向 Garcia 家展示的那些满足部分但不是全部标准的住房。总结全部的流程图包括 Prepare data Limit searchable homes Select homes with desired attributes Keep homes in desired schoo
21、l areas Keep homes near desired park Display results and prepare report 检查和表达结果 在 ArcMap 中,可以创建地图和图表直观表达数据,创建表格和报告以检验列表数据。图形和表格可以结合使用。例如,在地图中插入表格或将地图或图表插到报告中。这些显示方式可以在分析过程中灵活使用,以创建专业的表达形式。具体使用主要考虑如下: 分析项目若产生很多新信息,则只考虑表达精华。此外,如果目标是验证不同选项或标准,则需要表达多种情景。 要表达的是空间信息、属性信息,还是二者兼有?要素位置和关系等空间信息最适合于地图。一系列的要素及其
22、属性较适合用表格或报告。图表则适用于比较属性或显示趋势。以地图方式表达数据 分析过程中所创建的地图可能不适用于表达最后的分析结果。分析产生的地图通常要准备迅速、直观简单。符号和色彩易于区分选中的要素,包含尽可能少的陪衬,只添加必要的图层和要素标识。 与之相反,一幅显示地图应该包括有助于解释其背景和目标的信息。例如,根据目标添加道路、地标、行政界线等数据层。需要仔细选择地图符号,以符合一般习惯和行业标准,并能传递期望的信息。可能还要标注更多的要素,甚至插入文本或图形,以突出重要的要素、关系或分析结果。 以报告形式表达数据 报告可以帮助组织、设计和打印表格信息。它可以充满创意,但应考虑一下逐点:
23、选择所要包含的属性字段; 包括表格中的全部记录/选中的数据集; 基于一个/多个字段中的值对记录进行分类; 分组记录和计算摘要统计(如:总和、均值、个数) ; 选择所包含的元素,如:题目、图像或页数等; 选择表格的形式(字段的纵横格式,是否跨页) 。 如果所创建的报告要多次使用或包含在多幅地图中,可将其保存为文件。使用时加载即可。所保存的文件与实际的数据无关,不能修改。导出的报告包括.pdf、.rtf、.txt 等格式。 练习 3-4 对分析结果制图和创建报告 在准备与 Paul 和 Mira Garcia 回家的旅程中,要打印出即将访问的 5 家的一些基本信息。例如,地址、所寻的各家价格,并在
24、地图上标出他们的位置。本练习将创建一个简单表达地图,以显示分析的结果,然后将地图导出成一个图像文件,再将这个图像添加到报告中。 第二章 矢量数据分析 (Vector Data Analysis) 2.1 邻近分析 2.2 空间提取 2.3 叠加分析 2.4 网络分析 2.1 邻近分析(Proximity analysis) 当现实的实体被抽象为几何对象时,就可 以对它们之间的距离进行查询和分析。 一般来说,邻近分析或研究两个对象之间 的距离,包括通过空间连接和建立缓冲区 来发现最近的邻居。 1. 距离量测 寻找最近的邻居 距离量测是指要素之间直线(欧式)距离的量测。 量测可在一个图层中的点到另
25、一图层的点之间,或一个图层的各点到另一图层中最邻近点或线之间进行。量测的结果保存在一个字段中。 通过空间连接(spatial join)作为邻近分析工具来实现操作。 课堂练习:点与线之间的距离量测 练习内容: 要求对 deer.shp 中的每个鹿场点和 edge.shp 中原始森林与皆伐区边缘的最近距离进行量测。 练习方法: 通过定位方法使用合并数据; 使用 Analysis Tools/Proximity 工具箱中的 Near 工具。 2. 缓冲分析( Buffering) 缓冲区:为了识别某一地理实体或空间物体对其周围地物的影响度, 而在其周围建立的具有一定宽度的带状区域。 缓冲区分析:是
26、对一组或一类地物按缓冲的距离条件,建立缓冲区多边形,然后将这一图层与需要进行缓冲区分析的图层进行叠加分析,得到所需结果的一种空间分析方法。 基本思想: 给定一个空间对象或集合; 确定其邻域,邻域的大小由邻域半径 r 决定,对象 A 的缓冲区定义为 P 为距 A 的距离小于 r 的全部点的集合 d 一般指最小欧氏距离,但也可以为其它定义的距离,如网络距离,即空间物体间的路径距离。(一)角分线法(也称“简单平行线法” ) (二)凸角圆弧法 分区和法律问题(Zoning and legal issues ): 某些城市制订了法规,禁止在小学周围 1 公里内出售烈性酒。对此,首先对各小学建立 1 公里
27、的缓冲区,然后查询其中的商业地块,以确认其中没有违规的商店。 应急准备(Emergency preparedness ): 围绕某一地震断层建立 1 公里的缓冲区,以查询其中有多少大型商场。然后,确认哪些商场处在最危险的地震带之中。 2.2 空间提取(Spatial extraction) 空间提取是进行空间分析时,在一开始和 结束前经常采用的步骤,以减少输出结果 中要素的数量。 在街道两侧建立 10 米的缓冲区,首先要从城市街路图层中选择需要加宽的街道。 在进行了一系列地学处理之后合并许多小的多边形。 建立子集(Creating subsets) 通常情况下,一个数据图层包含了许多要素,而所
28、开展的研究只集中在其中的一部分。 通过对要素建立子集的方法,可以减少要素的数量。 剪切要素(Clipping features) 消减要素(Dissolving features) 提取与邻近分析应用示例:城市土地利用分析(Performing extraction and proximity analysis: Analyzing a citys land use) 一个城市土地的利用方式将影响其中居民 的生活。如果某一城市中许多城区充满工 厂、烟雾和噪声污染,这些必将会影响到 当地居民的生活质量。城市的公园和绿地 则会改善当地的生活,使人们远离噪声和 空气污染。 为了发挥城市绿地的作用,城
29、市的长期保 护规划将提出相应的保护措施。 2.3 叠置分析(Overlay Analysis) 叠置分析是 GIS 中常用提取空间隐含信息的方法之一。它是将有关主题的各个数据层面进行叠置产生一个新的数据层面,其结果综合了原来两个或多个层面要素所具有的属性,同时不仅生成了新的空间关系,也产生了新的属性关系。其中,被叠加的要素层面必须基于相同坐标系统,同一地带还必须基于相同的基准面。 从原理上来说,叠置分析是对新要素的属性按一定的数学模型进行计算分析,其中涉及逻辑交、并、差等运算。 根据操作要素的不同,叠置分析可分成点与多边形叠加、线与多边形叠加、多边形与多边形叠加; 根据操作形式的不同,叠置分析
30、可分为图层擦除、识别叠加、交集操作、均匀差值、图层合并和修正更新。 叠加操作的类型(Types of overlay operations) 点对面的叠加(Point-in-polygon) 点对面的叠加是将一个点图层和一个面图层在空间上相结合,建立一个新的点图层。这类叠加用于发现落入多边形中的 点。 假设找出每个普查单元中杂货店的数量。新的(输出)杂货店的点要素类将拥有普查单元的属性。据此可以查询某个商店所属的普查单元,或查找每个普查单元内全部商店的数量。 线对面的叠加(Line-in-polygon ) 线对面的叠加是将一个线图层和一个面图层在空间上相结合,建立一个新的线图层。这类叠加用于
31、发现一个线要素类和一个多边形要素类之间共同的地理空间。 如果有河流要素类和宗地要素类,就可以发现 哪条河落入到哪个地块中,准确的找出每个地 块中包含了多少河流。输出的结果要比通过的相交查询更精确,因为输 入要素通过叠加实现了 物理上 的切断,并重新 计算了长度。 面对面的叠加(Polygon-on-polygon)面对面的叠加是将两个不同图层中的多边形要素结合成一个单一图层。这类叠加操作可以研究两个要素类之间的共同区域。 如果第一个要素类代表行政区,第二个要素类代表洪泛区,据此可以发现洪水的风险和每个行政区内所包含的洪泛区的位置。 图层擦除(Erase) 图层擦出是指输入图层根据擦除图层的范围
32、大小,将擦除参照图层所覆盖的输入图层内的要素去除,最后得到剩余的输入图层的结果。数学的空间逻辑运算表示为: 识别叠加(Identity) 输入图层和另外一个图层进行识别叠加,在图形交迭的区域,识别图层的属性将赋给输入图层在该区域内的地图要素,同时也有部分的图形的变化在其中, 交集操作(Intersect ) 交集操作是将两个图层的要素和属性的交集部分结合成第 三个图层,原图层的所有属性将同时在新图层上显示出来。输出图层将包含与输 入图层相同的要素类型和属性数据项。如 果输入的都是多边形图层,则输出图层将 会反映出要素和属性的结合。 在数学运算上表现为: x AB(A,B 分别是进行交集的两个图
33、层) 。由于点,线,面三种要素都有可能获得交集所以它们的交集的情形有七种: 图层合并(Union ) 图层合并是一次将两(多)个多边形图层结合成一个新多边形图层。新图层中包括了两(多)个图层中所有的多边形和属性,通常会有更多的多边形。相当于布尔运算的 or,输出图层对应于输入图层或叠加图层的叠加范围。图层合并将原来的多边形要素分割成新要素,新要素综合了原来两(多)层属性。图层合并的数学表达式为: xx AUB 叠加分析与属性Overlay analysis and attributes Whenever you perform a union or intersect, in addition
34、 to feature geometry the input layers attributes are joined. Both the input layer feature identifiers and user-added attribute fields are added to the output layers attribute table. 合并的结果(上表)显示了所有处在缓冲区内 (BufferDist = 500) ,并 Landuse = 134 的多边形。也 可以知道缓冲区的面积。 相交的结果(下表) 。只要列出属性表就可以知道 哪些地块、有多少地块落在了缓冲区内。
35、 交集取反(Symmetrical difference) 均匀差值就是在两个图层叠置中去掉它们之间的公共部分后剩下的部分,同时对原有图层空间上的分布进行一定区域内的调整,新生成图层的属性是综合两者的属性而产生的。其数学逻辑运算式表示为:x AUB - AB( A,B 为两个输入图层) 。 破碎多边形(Slivers) 破碎多边形是来自地图叠加过程中的常见误差。 GIS 软件通过模糊容差(fuzzy tolerance)去除破碎多边形 合适的模糊容差值是去除破碎多边形的关键 最小制图单元(minimum mapping unit)表示由政府机构或公司部门指定的最小面积单元。 最小制图单元是很好的去除破碎多边形的方法