geographic information analysis€¦ ·...

30

Upload: others

Post on 17-Aug-2020

35 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图
Page 2: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

GEOGRAPHIC INFORMATION ANALYSIS

地理信息分析

(原著第二版)

〔新西〕David O摧Sullivan〔英〕David J畅Unwin  著

赵  永  译王劲峰  审校

河南省国家重点学科培育计划国家自然科学基金 (40901284)

 联合资助

北  京

Page 3: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

图字 :01‐2011‐4977

内 容 简 介

本书是 2010年 John Wiley & Sons出版图书 Geographic Information A nalysis(SecondEdition)的翻译版 。内容涵盖空间分析的基本问题与基本方法 ,涉及制图基础 、过程与模式 、

点模式分析 、面对象与空间自相关 、局部统计量 、场数据分析 、地图叠置 ,以及地理计算 、空间

模型 、网格和云计算等空间分析的前沿问题与新方法 。

本书可作为空间分析 、空间数据分析 、空间统计 、空间模型与建模等地理信息科学领域

的本科生和研究生教材 ,也可供该领域和相关学科的研究人员参考 。

眖 2010 by John Wiley & Sons ,Inc畅All Rights Reserved畅 This translation published under license畅 Authorized translation fromthe English language edition ,entitled Geographic Information Analysis ,2nd ,ISBN 978‐0‐

470‐28857‐3/0‐470‐28857‐4 ,by David O摧Sullivan and David J畅 Unwin ,Published by JohnWiley & Sons畅 No part of this book may be reproduced in any form without the w ritten per‐mission of the original copyrights holder畅

 图书在版编目(CIP)数据 地理信息分析 :第 2版/(新西兰)奥沙利文(O摧Sullivan ,D)等著 ;赵永译畅 —北京 :科学出版社 ,2013畅3

  (地理信息系统理论与应用丛书)

 书名原文 :Geographic Information Analysis  ISBN 978‐7‐03‐036735‐8

  Ⅰ畅 ①地 ⋯   Ⅱ畅 ①奥 ⋯ ②赵 ⋯   Ⅲ畅 ①地理信息系统 -分析方法   Ⅳ畅 ① P208 中国版本图书馆 CIP数据核字(2013)第 033924号

责任编辑 :朱海燕  陈婷婷 /责任校对 :鲁  素

责任印制 :钱玉芬 /封面设计 :王  浩

出版北京东黄城根北街 16 号

邮政编码 :100717

http ://www畅 sciencep畅 com印刷

科学出版社发行   各地新华书店经销

2013 年 3月第 一 版     开本 :787 × 1092   1/16

2013 年 3月第一次印刷 印张 :18 1/2

字数 :436 000

定价 :59畅00元(如有印装质量问题 ,我社负责调换)

Page 4: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

David O摧Sullivan :献给我的父母

Dave Unwin :献给 Polly ,英国皇家园艺协会 2009年切尔西花展金质奖章得主

Page 5: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第二版序言本书第一版 (O摧Sullivan and Unwin ,2003) 写于 21世纪的头两年 ,其基本框架依托

于在地理信息科学中具有悠久历史的两个关键思想 ———制图学思想和统计学思想 。敏锐和

年长的读者也许会注意到书中某些章节来自于 Introductory S p atial A nalysis (Unwin ,

1981) ,那是本书的作者之一在约 30年以前写的一本小册子 。其第一个关键思想是在长度

维的框架下 ,把地理对象描述为点 、线 、面和连续性表面 (场) ;第二个关键思想是把图

示分布看作是某种空间随机过程的实现 。

与其他任何框架一样 ,这些观点是不完美的 。如严重依赖于固定的几何实体 ,并高度

重视统计假设检验 ,从空间表达和统计推断发展的角度来看 ,这可能有些过时 。在第二版

中 ,关于与时俱进和采用不同的替代框架 ,我们进行了一段时间的思考 。最终没有轻易坚

持使用原方案 ,但我们确信我们的决定是对的 。自从该书第一版出版后 ,我们基于这一框

架 ,在美国 、英国 、新西兰以及通过互联网在全球 ,已经教授了高年级本科生和初级研究

生水平的课程班 ,并发现其是清晰的和富有弹性的教学方法 。对于大多数学生而言 ,无论

是空间数据还是统计推理都是新的或比较新的内容 ,重要的是 ,我们为这样很大一部分读

者打开了一道通向更高级知识领域的 “大门” 。对于少数熟悉这两部分内容的读者 ,我们

希望该书内容的覆盖面足够广 ,并且能够获得读者对于书中保留的更高级内容的充分认

同 。

机    会

尽管第二版与第一版之间具有广泛的一致性 ,但通过逐章比较 ,便会看出我们在点模

式分析 、空间自相关 、克里金和空间数据回归处理的内容上进行了大量更新和许多较大改

动 。其中一些是为了强调 ,而另一些则是为了使内容更加充实 。熟悉第一版的读者会发

现 ,传统的统计假设检验进一步让位于更受重视的蒙特卡洛/随机化方法 ,因为在大多数

实际工作中使用的杂乱数据通常需要经过预先处理 ,在我们看来 ,这一方法提供了与空间

数据有关的众所周知的问题的很多方面 。甚至在本书第一版出版 7年后 ,计算能力的提高

使这一方法的应用更加切合实际且更容易实现 。此外 ,读者还会发现第二版中更重视对局

部的描述 。我们相信 ,这反映了科学方法论上的一个重要的变化 ,并且其在当今计算环境

中的实现已经成为可能 。

这两个主要的改变 ,遵循并追溯这些重要的变化 ,因为我们增加了关于地理可视化

(第 3章) 和局部统计量 (第 8章) 的全新篇章 。事实上 ,还有为本书第一版准备的关于

地图和制图的一章 ,但最终并没有采用 。我们自己的解释是 :要注意压缩篇幅 ,并考虑到

大多数读者已经熟悉制图科学与艺术的一些核心概念 。随后 ,针对被称为 “半路出家的地

理学者” (Unwin ,2005) 的地理信息分析课程的教学经验表明 ,这一疏忽是个错误 。 “半

Page 6: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

ii 地理信息分析

路出家的地理学者” 一词 ,是指那些空间数据分析的新手 ,他们对地理科学的理解在很大

程度上是基于地理信息系统 (GIS) 软件进行的可能操作 。有三个原因增加了制图 (或者

如果你愿意 ,可称之为地理可视化) 的切题性 。首先 ,即使现在有为数众多的统计方法可

用 ,某些形式的制图或许仍然是主要的分析策略 。其次 ,强调局部统计量并进行制图 ,增

大了对理解制图基本原则的需求 。第三 ,到几乎任何的 GIS 贸易展览会上走一走 ,你都将

发现 ,即使有经验的 GIS用户也会继续犯很基本的制图错误 。新的第 3章与原先拟定的内

容相似性很小 。新材料在很大程度上依赖于使用互联网搜索引擎来查找和评论例子 ,这是

差不多半个世纪以前本书年长的作者在地图欣赏课堂上学习到的东西 。但即便如此 ,我们

仍采用悠久的 、有时会令人遗憾地被忽略的传统制图方法 ,确定这一章的大部分内容 。

第二个主要的补充是关于局部统计量的一章 。同样 ,这也有素材组织上的问题 ,因为

正如我们已经发现的那样 ,最初在不同背景下形成的资料 ,其中有相当大的比例可以理所

当然地纳入这个框架 。 如包括所有与距离 、 邻接和邻域概念相关的定义空间权重矩阵

(W) 的资料 ;利用控制点数据对场平均高度的估计 ———空间插值 ;点过程强度估计中 ,

局部峰值的识别 ———聚集 ;以及通过对空间自相关全局 Moran摧s I的分解 ,识别相似的空

间区域 ——— Moran散点图 。读者无疑会发现其他的例子 ,它们是很多空间分析中的核心概

念 。该章提供了很多更为明确的空间相关性局部指标 ,并包括了对地理加权回归 (GWR)思想的介绍 。尽管也可以很容易地把核密度估计 (KDE) 放在同一章中 ,但我们认为它在

地理可视化的背景下最为常用 ,所以把它从原来的第 3章移到了第 5章的点模式分析中 。

我们意识到 ,这些变化会使读者有必要不时地返过头来参考以前的材料 ,当有必要使用思

考练习的时候 ,我们尝试发出这种信号 。

通过删减一些材料 ,本版中增加的内容在篇幅上得到了平衡 。首先 ,出于完全务实的

原因 ,我们删除了几乎所有的线对象分析内容 。虽然该书第一版中用一章讨论了线对象分

析的一些基本思想 ,但由于篇幅的原因 ,它没有 、也不可能反映几乎所有科学分支中网络

分析的日益重要性 ,我们两位作者对这一章很不满意 。读过那一章的读者都会认识到 ,当

处理线对象时 ,我们竭力采用基本的随机过程方法 。某个人 、在某个地方 、某一天 ,会写

这样一本所需要的书 ———一本关于用网络表达的地理信息分析的书 ,但其内容要远远超出

在该书第一版中那一章所涵盖的篇幅 。本书第一版中关于多元统计量的一章 ,感觉把 n维数据当作空间数据有些不适宜 ,故将其删去了 。只保留其中的一些材料 ,在第二版关于地

理可视化的一章中以 “空间化” 的标题形式出现 。除了这些较大的调整 ,我们还取消了对

描述空间自相关的连接数分析方法的扩展处理 ,它虽然有益于教学 ,但似乎与当今的实践

越来越不密切 。最后 ,为了保证本书的篇幅适宜 ,放弃了介绍基本统计概念的一个附录 ,

我们假设读者能够从众多优秀的入门教科书中获得这些知识 。

自从本书第一版出版后 ,情况已经发生了很大变化 ,计算科学 、统计学和地理信息科

学的一般领域都有很大的发展 。在材料更新过程中 ,我们试图尽力反映这类新成果和它所

处的日益 “局部觉醒的” 科学和社会环境 ,但我们知道很多内容被略去了 。如果你很失望

没有看到你想要的东西 ,我们只能表示歉意 。

Page 7: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第二版序言 iii

软    件

我们力图反映的一个重大变化是 ,学术型空间分析者所采用的方法与大多数商业 GIS中所提供的嵌入型空间分析功能之间的差距在日益扩大 。诚然 ,如果你知道自己在做什

么 ,并且不总是依赖于软件的默认设置 ,那么我们所描述的许多方法可以在这种软件系统

中应用 ,但这种应用是不理想的 。在过去的十年中 ,当今最领先的研究人员已经在公共 R语言环境中 (Ihaka and Gentleman ,1996) 进行他们的研究工作 ,而这已变得越来越明

显 。希望实践我们所介绍的方法的读者应当注意 ,几乎所有方法以及更多其他方法 ,已经

在 R语言环境中实现 (Baddeley and Turner ,2005 ;Bivand et al畅 ,2008) ,强烈建议希望

开发新的和创新的地理信息分析方法的读者加入这个学者们的社区 。

David O摧Sullivan奥克兰大学

Dave Unwin伦敦大学伯贝克学院

2009年毛利新年

参 考 文 献

Baddeley ,A畅 and Turner ,R畅 (2005) Spatstat :an R package for analyzing spatial point patterns畅 Journal o fStatistical Softw are ,12 :1‐42畅

Bivand ,R畅S畅 ,Pebesma ,E畅 J畅 ,and Gomez‐Rubio ,V畅 (2008) A p p lied Sp atial Data A nalysis w ith R(New York :Springer) 畅

Ihaka ,R畅 and Gentleman ,R畅 (1996) 畅R :a language for data analysis and graphics畅 Journal o f Com puta‐tional and Graphical Statistics ,5 :299‐314畅

O摧Sullivan ,D畅 and Unwin ,D畅 J畅 (2003) Geographic Information A nalysis (Hoboken ,NJ :Wiley) 畅

Unwin ,D畅 J畅 (1981) Introductory S patial A nalysis (London :Methuen) 畅

Unwin ,D畅 J畅 (2005) Fiddling on a different p lanet畅Geoforum ,36 :681‐684畅

Page 8: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

致     谢

David O摧Sullivan

在本版中 ,宾夕法尼亚州地理学课程 (编号 : GEOG 454 、 455 、 586) 和奥克兰地理

学课程 (编号 :GEOG 318 、 771) 中的学生和同事以多种方式 ,或多或少地帮助完善了材

料 。我对 David Dibiase ,Mark Gahegan , Frank Hardisty , Jim Harper和 George Perry 通过各种形式给予的支持表示感谢 。我也要感谢奥克兰大学的一个研修奖项和空间认知教学

(SpLinT ) 协会 (英国莱斯特大学与诺丁汉大学 、伦敦大学学院) ,尤其是 Paul Longley和 Nick Tate ,感谢他们在 2008年提供的研究奖金 。研修和 SpLinT 奖使得Dave和我一起为本书工作了愉快而富有成效的几天 ,并帮助设计了这个版本 。

我也感谢 Gill ,感谢她一直以来的宽容和支持 。最后 ,周六早上 Fintan和 Malachy 学院在板球场和足球场上的过招 ,更不用说深邃的虚拟 LEGOTM星系 ,随时随地都提醒着我

事物的真正中心在哪里 。

Dave Unwin

华盛顿 “空间培训班” 点燃了我的研究生的空间分析热情 ,而最终遇到他们几个是一

件很高兴和荣幸的事 。伦敦阿伯里斯特威斯 、莱斯特和伯贝克地理系提供了研究基地 ,并

且有知识渊博的同事 。特别感谢在莱斯特中部地区研究实验室与我一同讨论众多问题的以

前的同事 ,他们是 Alan Strachan , Mike Worboys , David Maguire , Jo Wood , JasonDykes ,以及最近认识的 Pete Fisher 。所有教师都应该向他们的学生学习 ,我非常愉快地

承认他们对我思想形成的贡献 ,有时是在不知不觉中 ,有时是直接受到了如下研究生班的

启发 :英国的莱斯特大学 、伦敦伯贝克学院和伦敦大学学院 ,新西兰的怀卡托大学和坎特

伯雷大学 ,以及美国的雷德兰兹大学 。一个最后和特别形成的经验是 ,在互联网上对 “半

路出家的地理学者” 进行的教学和辅导班 ,已经证实了我的信念 ———在科学中应用地理学

的价值 。像我的同事一样 ,我很感谢 SpLinT 的发起者在 2008年给予的支持 。

仍然存在的可能的错误 ,当然由我们自己负责 。

David O摧Sullivan奥克兰 ,新西兰

Dave Unwin梅德韦尔 ,英格兰

Page 9: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第一版序言这本书由一本小册子 “自由成长” 起来 ,那本小册子是我们中的一位作者从 1979年

至 1981年写的 (Introductory Sp atial A nalysis ,伦敦 :梅休因出版社) 。虽然它在第一个

商业地理信息系统 (GIS) 出现后整整十年 ,并差不多与第一台微型计算机问世的时间一

致 ,但那本书的传统根植于 20世纪 60年代的计量地理学方法 ,并且所采用的工具比一个

便携式计算器复杂不了多少 。从 1983年起我们尝试出版第二版的计划总是被其他项目搁

置 ,这些项目几乎总是与 GISs在当代的迅速发展有关 。与此同时 ,电脑在发达国家普及

到几乎每个人 ,在科学研究和商业中许多人发现了应用 GIS 软件的地理学潜力 。到 20世

纪 90年代末 ,很明显 ,只有一本全新的教材才能够如此 ,是在这一点上我们两人开始联

手做这项工作 ,其结果就是现在的这本书 。

本书所涵盖的内容已经实践了相当长的时间 ,并已在我们任教的莱斯特 、伦敦 (伦敦

伯贝克学院和伦敦大学学院) 、 宾夕法尼亚 (宾夕法尼亚州) 、 怀卡托 、坎特伯雷 (新西

兰) 和其他地方的大学高年级本科生和研究生课程中试用过 。我们热爱在几乎任何工作中

介绍的与地理数据相关的有用概念和技术 ,并且希望能成功地传达给读者 。关于这些思想

狂热的或率真的应用 ,我们也希望当中所陈述的保留意见不损害我们根本的积极性 。我们

的许多保留意见源于一个原因 ,即利用当前 (或许将来 ?) 可能的技术数字化地表达外部

现实的限制性 。我们觉得 ,如果 GIS 是用来作为支持地理学中各种研究方法的一种有效工具 ,而不是作为 “回答” 每个地理问题的一种万全之策 ,那么即使是对该领域的新人 ,揭

示这种不确定性也是恰当的 。

虽然计划上不是这种方式 ,但经过再三考虑 ,我们从精心制订 、全面阐述基础知识开

始 ,并基于 Introductory S p atial A nalysis的理性传统进行讲述 ,一直到对最近的计算密

集型方法比较散漫的描述 。早期的材料强调基本概念和问题的重要性 ,这对把统计方法应

用于空间数据的任何尝试而言很常见 ,并应当为后面章节中更一般地讨论的更高级方法的

进一步研究 ,提供一个坚实的基础 。我们提供的一些较老的参考文献表明这样的一个事

实 ,即至少现在被称为地理信息科学的一些慧根 ,牢牢地根植于 20世纪 60年代的地理学

和各种不同的学科 。近些年在地理数据分析中看到大量的技术创新 ,我们希望能够在该书

和建议阅读的材料当中 ,捕捉到一些令人兴奋的内容 。

通篇让我们纠结的两个问题是数学和符号的应用 。这两者联系在一起 ,都需要谨慎对

待 。数学上 ,我们试图尽可能严谨并与目标受众相一致 。经验表明 ,找到他们的 GIS 分析方法 ,并希望更深入地探讨一些问题的学生 ,具有特别不同的数学背景 。 因此 ,我们的

“严谨” ,经常表现为仅仅采用正式的符号 。除了第 9章单独的 “这可以证明” 外 ,我们设

法避免使用微积分 ,但在整个第 5章及以后使用的矩阵和向量符号 ,对于完整地理解相关

方法 ,大抵是必不可少的 。附录 B提供了一个关于矩阵和向量的指南 ,对大多数读者而言

应该足够了 。如果把该书作为一门课程使用 ,我们强烈建议教师在讲述正文之前 ,在适当

Page 10: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

viii 地理信息分析

时候花些时间介绍本附录的相关内容 。我们假设读者具有基本的统计学基础 ,但为了保险

起见 ,我们包含了一个类似的附录 ,概述了所用的主要统计思想 ,以及类似解释 。

差的符号有着混淆的巨大可能性 ,而空间分析是以很多变量称道 (也许是让人讨厌)

的领域 。绝对的一致性是难以保证的 ,并且在任何情况下这都可能是一种过于乐观的估

计 。我们力图尽可能地一致和明确 。也许在这方面最不和谐的是在第 8章和第 9章中介绍

的第三维位置坐标 ,它用字母 z表示 。当在 9畅3节讨论空间坐标回归时 ,这将会导致一些

尴尬和稍微的符号变化 。经过权衡 ,比起太多的书页中下标林立 (快速地翻一下书 ,确保

你们不应被保留下来的许多下标吓倒) ,我们宁愿使用 (x , y , z) 并容忍不一致的指责 。

就像该书的前身 ,这种实用方式应作为一种醒示 ,提醒这是关于地理信息实际分析的一本

书 ,而不是作为一本空间统计学专著 。最主要的 ,这是一本地理书 !

涵盖这么多基础的这样篇幅的一本书 ,可能永远不会只是两个人的工作 ,而没有其他

人的帮助 。多年来 ,我们中的一位得益于与教育领域的同事和地理信息企业的接触 ,他们

太多而不能一一列出 。他对所有意见 、讨论与心平气和的争论表示感谢 。在这个迅速发展

的领域 ,它是开放和建设性氛围的一种证明 ,这种伙伴关系中年轻的一方已经受益于许多

类似的接触 ,这也很难一一列出 。我们只想说 ,英国伦敦大学学院的高级空间分析中心和

宾夕法尼亚州州立大学地理系的支持对此帮助很大 。照例 ,存在的错误仍由我们负责 。

David O摧Sullivan宾夕法尼亚州立大学

2002年圣基兰节

Dave Unwin伦敦 ,英格兰

2002年情人节

Page 11: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

目     录第二版序言

致谢

第一版序言

第 1章  地理信息分析与空间数据 1⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 1⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅1  引言 1⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅2  空间数据的类型 3⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅3  一些困难 6⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅4  属性描述的尺度 12⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅5   GIS 与空间数据操作 16⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

1畅6  前面的路 19⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 19⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 20⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 2章  空间数据的陷阱和潜力 22⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 22⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

2畅1  引言 22⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

2畅2  坏消息 :空间数据的陷阱 23⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

2畅3  好消息 :空间数据的潜力 27⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 35⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 35⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 3章  基础 ———把它图示出来 37⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 37⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅1  引言 :制图学传统 37⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅2  地理可视化与分析 39⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅3  雅克 ·伯汀的图形变量 40⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅4  新的图形变量 42⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅5  地理可视化中的问题 43⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅6  制图和探索点数据 44⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅7  制图和探索面数据 49⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅8  制图和探索场数据 54⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅9  非空间数据的空间化 57⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3畅10  总结 58⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 59⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

Page 12: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

x 地理信息分析

参考文献 59⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 4章  基础 ———把地图作为过程的结果 63⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 63⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅1  引言 :地图和过程 63⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅2  过程及其所产生的模式 64⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅3  预测由过程产生的模式 68⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅4  更多定义 72⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅5  线 、面和场的随机过程 73⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4畅6  总结 78⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 79⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 80⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 5章  点模式分析 82⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 82⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5畅1  引言 82⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5畅2  描述一个点模式 83⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5畅3  统计地评估点模式 94⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5畅4  蒙特卡洛检验 100⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5畅5  总结 103⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 104⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 104⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 6章  实用点模式分析 106⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 106⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅1  引言 :空间统计分析的问题 107⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅2  常规统计推断的替代方法 108⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅3   IRP/CSR的替代模型 109⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅4  现实世界中的点模式分析 112⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅5  处理非齐次性 114⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅6  焦点检验 116⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅7  聚集探测 :扫描统计量 117⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅8  应用密度和距离 :近邻多边形 120⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6畅9  距离矩阵和点模式分析的一个注记 122⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 123⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 124⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 7章  面对象与空间自相关 127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

7畅1  引言 :面对象复习 127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

7畅2  面对象的类型 127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

7畅3  面的几何特性 130⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

Page 13: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

目    录 xi

7畅4  测度空间自相关 135⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

7畅5  一个例子 :2001 ~ 2006年奥克兰的肺结核 140⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

7畅6  其他方法 143⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 144⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 145⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 8章  局部统计量 147⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 147⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅1  引言 :地理地思考 ,局部地测度 147⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅2  局部性定义 :再次提到空间结构 149⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅3  一个例子 :Getis‐Ord Gi和 G 倡i 统计量 149⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅4  局部统计量推断 152⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅5  其他局部统计量 154⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

8畅6  总结 :局部地看世界 159⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 160⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 160⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 9章  场数据描述与分析 162⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 162⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅1  引言 :标量和向量场回顾 162⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅2  模拟与存储场数据 164⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅3  空间插值 169⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅4  表面的衍生测度 178⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅5  地图代数 183⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

9畅6  总结 185⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 186⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 186⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 10章  认识未知 ———场统计学 188⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 188⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

10畅1  引言 188⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

10畅2  空间坐标回归 :趋势面分析 189⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

10畅3  平方根差云图和 (半) 变异函数 195⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

10畅4  统计插值方法 :克里金 199⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

10畅5  总结 211⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 212⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 212⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 11章  把地图放在一起 ———地图叠置 214⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 214⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅1  引言 214⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅2  布尔叠置与筛选叠图 216⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

Page 14: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

xii 地理信息分析

11畅3  替代布尔叠置的一般模型 221⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅4  指数叠置与加权线性组合 222⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅5  证据权重 225⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅6  应用回归的模型驱动叠置 226⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

11畅7  总结 227⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 228⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 228⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

第 12章  空间分析新方法 231⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章目标 231⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅1  不断变化的技术环境 231⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅2  不断变化的科学环境 233⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅3  地理计算 234⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅4  空间模型 239⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅5  网格和云 :超级计算简介 245⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

12畅6  总结 :新地理信息分析 ? 247⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

本章回顾 248⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 248⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

附录 A  符号 、矩阵和矩阵数学 253⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅1  简介 253⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅2  符号的一些基本说明 253⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅3  矩阵基础与符号表示 255⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅4  简单的矩阵数学 257⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅5  用矩阵求解联立方程组 261⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅6  矩阵 、向量和几何结构 264⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

A畅7  特征向量和特征值 266⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

参考文献 267⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

词汇表 268⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

译后记 276⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

Page 15: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1 章   地理信息分析与空间数据

本 章 目 标

在本章中 ,我们 :

瞯定义本书中的地理信息分析 。

瞯当涉及地理信息分析和基于 GIS 的空间数据操作时 ,能够把两者区分开 。

瞯概述空间数据的实体 属性模型 ,它由点 、线 、面和场组成 ,具有相关的名义量 、

次序量 、间隔量和比率量 。

瞯注意针对空间数据模型观点中的某些困难 ,特别是不同尺度上的多重表达 、时间 、

具有不确定边界的对象 、模糊对象和可能是分形的对象 。

瞯概述空间数据操作处理 ,并强调它们的重要性 。

瞯探讨地理实体表达形式之间的不同转换 ,指出它们在地理信息分析中的用途 。

读过本章后 ,你应该能 :

瞯列出 4种不同的空间分析方法 ,以及它们之间的不同 。

瞯说出为什么现代空间分析方法没有很好地嵌入典型 GIS 工具包中的原因 。

瞯区分空间对象和空间场 ,并讨论为什么 GIS中矢量与栅格的争论 ,实际上是如何选

择表达这些实体类型的问题 。

瞯区分并举例说明点 、线和面对象 。

瞯列出描述一个场的基本的数据特征 。

瞯提供不易纳入该体系的现实世界实体的例子 。

瞯对现实世界实体在数字化数据库中的表达 ,以及它在地图上的显示保持清醒的

区分 。

瞯区分并举例说明名义量 、次序量 、间隔量和比率量 4种属性数据 。

瞯给出至少 12种空间数据组合类型的例子 。

瞯列出典型 GIS中一些基本的几何数据操作 。

瞯概述可以对实体表达进行转换的方法 ,并解释为什么这对地理信息分析有用 。

1畅1  引    言

地理信息分析不是一个已经建立起来的学科 。实际上 ,它是一个比较新的概念 。为了定

义我们用该术语所要表达的意思 ,首先有必要定义一个较老的术语 ———空间分析 ,然后描述

我们如何看待这两者之间的关系 。但是 ,简洁地定义空间分析也不容易 。空间分析在不同的

背景中提及 ,文献中分别以不同的方式应用该术语 ,它至少有四个可以识别的宽泛领域 :

Page 16: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l2     地理信息分析

(1) 空间数据操作 ,一般应用于地理信息系统 (geographic information system ,

GIS) ,通常称为 “空间分析” ,在 GIS公司的宣传材料中更是如此 。 GIS 手册将让你明确这些技术的范围 ,如 Tomlin (1990) 和 Mitchell (1999) 。

(2) 空间数据分析 ,具有描述性和探索性 。这是所有空间分析中重要的第一步 ,并往

往可应用于非常庞大和复杂的数据集 。 地理学家 ,如 Unwin (1982) 、 Bailey 和 Gatrell(1995) 、 Fotheringham 等 (1999) 的书遵循这一传统 。

(3) 空间统计分析 ,应用统计方法研究空间数据 ,以确定数据是否可以用一个统计模

型来表示 。上述提及的地理教科书涉及这些问题 ,并有少数统计学家对空间数据分析感兴

趣 ,特别是 Ripley (1981 ,1988) 、 Diggle (1983) 和 Cressie (1991) 。

(4) 空间建模 ,需要构建模型预测空间结果 。在人文地理学中 ,模型用于预测物流和

人流 ,或者进行设施位置的优化 (Wilson ,2000) ,而在环境科学中 ,可利用模型尝试模

拟自然过程的动力学 (Ford , 1999) 。建模技术是空间分析的一个自然扩展 ,但超出了本

书的研究范围 。

实际上 ,通常很难区分这些方法 ,很多正式研究包含所有这四种方法 。首先 ,收集数

据 、可视化和进行描述性分析 ;接着 ,基于探索性技术可能提出问题 ,并就感兴趣的现象

给出理论建议 ;然后 ,用空间统计技术对这些理论进行统计检验 。于是 ,当前理论可以作

为感兴趣现象的模型构建基础 ,其结果 ,反过来 ,可能会需要进行更多的统计研究和

分析 。

不可能只考虑地理信息 ,而不考虑日益成为其分析基础的技术 ———地理信息系统

(GISs) 。虽然 GISs不是像 (比如说) 字处理器那样无处不在 ,但它们已经渗透到越来越

多的企业 、政府部门和其他决策机构 。即使这是你第一次阅读一本地理教科书 ,在不知情

的情况下 ,也许当你在网站上查找一个度假目的地地图时 ,或者是寻找行车路线时 ,你可

能已经使用了 GIS 。在以上的列示中 ,当前的 GISs通常包含条目 (1) 作为其基本内容 (因为一个没有这

些功能的 GIS将只是一个普通的 IS !) ,并包括一些简单的数据分析能力 ,特别是图示探索

性分析 [条目 (2)] 。最近 ,GISs开始包含条目 (3) 的一些统计方法 ,而只包括很少的

模型构建并确定其可能结果的功能 [条目 (4)] 。实际上 ,扩展 GIS 完成这种分析是困难的 ,这是为什么许多地理信息分析者应用其他软件的原因 ,这些软件属于条目 (3) 和条

目 (4) 。在本书中 ,我们主要关注条目 (2) 和条目 (3) 。在实践中你将发现 ,尽管可用

的工具在迅速发展 ,但空间数据的统计检验仍然相对缺乏 。统计方法可以很好地解决和认

识某些类型的数据 ,而对许多其他数据则并非如此 。

如果空间分析是如此需要 (甚至值得) 写一本书 ,那么它为什么不是标准的 GIS 工具包中的一部分呢 ?我们给出一些原因 ,其中包括 :

(1) 空间数据的 GIS视角与空间数据的空间分析视角是不同的 。空间数据的空间分析

视角更关注过程和模式 ,而不是数据库管理和操作 ;但大多数 GIS 购买者 (政府部门 、公

共机构) 对空间数据库的基本要求更为重视 ,而不是要求完成复杂的和有时是模糊的空间

分析 。

(2) 空间分析没有被广泛地认识 。空间分析不是很简单或特别容易 ,虽然在本书中我

Page 17: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l3    

们的目标是解决这一问题 。这个明显的困难意味着 ,很难说服软件生产商将空间分析工具

作为标准产品 。相反 ,空间分析工具可能是 GIS 经常忽视的一个附加产品 。近些年 ,这种

情况变得不太明显 ,因为软件工程方法使得 GIS 供应商可以提供独立出售的 “扩展模块”

给需要的用户 。同时 ,第三方生产商可以比以前更容易地提供附加组件 ,并且开源软件在

一些人群中已日益成为一种重要的选择 。

(3) 空间分析的视角有时掩盖了 GIS 的优势 。通过应用空间分析技术 ,我们往往提出

尴尬的问题 :“看起来那儿有一个模式 ,但它在统计上是显著的吗 ?也许不是 。” 这是一个

很困难的 GIS 软件产品卖点 !

除了对上述几点的关注之外 ,不要低估 GIS 提供的空间数据操作函数的重要性 ,比如

缓冲区 、点在多边形内的查询等 。这些是产生问题和形成假设的重要前提 。为了强调它们

的重要性 ,我们将在 1畅5节中综述这些主题 ,并考虑如何用统计方法加以改善 。更广泛地

说 ,空间数据的存储方式 ,或者说如何在 GIS 中表达地理现象 ,对分析变得日益重要 。因

此 ,我们将在 1畅2节和 1畅3节中花一些时间讨论该问题 。

基于这些原因 ,我们使用了更广泛的术语地理信息分析涵盖本书涉及的内容 。该术语

的一个实用定义是 :它关注模式的研究 ,而模式可能是过程的一个结果 。其中 ,表示 、描

述 、测度 、比较和产生空间模式的技术与方法 ,对地理信息分析的研究至关重要 。当然 ,

在这一点上我们的定义没有多大用处 ,因为它提出了一个问题 ,即这里的模式与过程是何

含义 。现在 ,我们将接受你对关键术语含义的任何直观理解 。当我们在第 4章和第 5章阐

述完点模式分析的概念后 ,这两个术语的意思将会变得更加清晰 。现在 ,我们将注意力集

中于了解可能遇到的一般空间数据类型 。

1畅2  空间数据的类型

思考练习 :地理表达

贯穿本书 ,你将发现思考练习会帮助你以更具体的方式理解教材 。通常 ,我们会要

求你做某件事 ,并利用这些结果得出一些结论 。你应该会发现 ,这些练习能帮助你记忆

书中介绍过的内容 。本书的第一个思考练习关注于如何在计算机里表达地理现象 :

(1) 假设你为一个道路养护机构工作 ,你的职责扩大到县以上大小区域内的道路 。

你的 GIS需要支持一些操作 ,比如表面重建 ,避免与同样在路上挖洞的其他机构 (比如

公共事业公司) 发生冲突 ,并改善路面结构 。

思考并写出你将如何在数据库中记录路网的几何结构 。 你会收集什么样的道路

属性 ?

(2) 想象一下 ,你现在在同一地区为一个巴士公司工作 。现在 ,GIS 必须支持这样的操作 ,如编制时间表 、提出对现有和潜在巴士新路线的需求 、优化站点配置 。

路网的几何结构及其属性与 (1) 中的建议有什么不同 ?

(3) 从这里我们可以得到什么简单结论 ?应该明确的是 ,如何表达相同的地理实体

依赖于表达的目的 。这是显而易见的 ,但它很容易被忘记 。

Page 18: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l4     地理信息分析

撇开有关技术问题 ,社会对地理信息分析的批评往往基于这样一个事实 ,即分析常

常局限于可以很容易地进行数字化表达的现实世界的那些方面 (Fisher and Unwin ,

2005) 。

当用地图思考世界时 ,你如何看待它呢 ?在早期的 GIS 文献中 ,通常区分两种系统 ,

它们以如何数字化表达理实体为特征 :

(1) 矢量系统 ,它记录构成地图的特征位置坐标 (x , y) 。在矢量观点下 ,我们列出

特征 ,并把每个特征表示为一个点 、线或面对象 。矢量 GIS 起源于基于数字化数据用计算机绘制地图 ,并受到特别重视 ,因为当时计算机存储器是一种昂贵的商品 。虽然匹配不精

确 ,但矢量模型最接近现实世界由对象组成的观点 ,它认为空间是一种空的容器 ,由不同

类型的对象填充其中 。

(2) 栅格系统 。它不是从地面上的对象开始 ,而是定义一个地表上称为 “像素” 的小

单位网格 。对于每个像素 ,记录下它的值 ,或者说是感兴趣的事物存在或不存在 。如此 ,

我们把地图划分为相同的离散单元 ,并列出每个单元的内容 。因为空间中的每个位置都有

一个值 (即使是零或空) ,所以栅格方法通常比矢量方法占用更多的存储空间 。栅格 GIS主要起源于图像处理 ,其中多数数据来源于遥感 。

在本节中 ,我们希望能够说服你 ,在更高的抽象层次上矢量/栅格的区分不是非常有

效 ,并且它模糊了一个更为重要的界限 ,即我们所说的对象观点和场观点之间的界限 。

对 象 观 点

在对象观点中 ,我们把世界看作是位于空间中的一系列实体 。实体 (通常) 是实际存

在的 ,你可以触摸它们 ,站在它们当中 ,甚至移动它们 。一个对象是一个实体的全部或部

分的数字化表示 。对象可以划分为不同的类型 ,如点对象 、线对象和面对象 ,在具体应用

中 ,这些类型由特定的对象进行实例化 。例如 ,在一个环境 GIS 中 ,森林和农田可能是面

对象的实例 。在对象观点中 ,空间能被任何数量的对象占据 。普查小区里有房子 ,其中可

能还包括灯柱 、巴士站 、路段 、公园等 。

因为对象观点也可能与对象的行为联系在一起 ,当具有良好定义的对象随时间发生变

化时 ,对象观点具有其优势 ———例如 ,一个普查对象区域内一系列人口普查数据的变化 。

请注意 ,我们没有说任何关于计算机科学意义上面向对象的概念 。 Worboys等 (1990) 给

出了与空间数据相关的这一概念的简单描述 。

场  观  点

在场观点中 ,世界由空间上连续变化的属性组成 。一个例子是地球本身的表面 ,其

中 ,场变量是海拔高度 。同样 ,地面上有或者没有一座房子 ,我们可以用一个格网单元对

其进行编码 ,其结果也是一个场 。在这个二进制数表达的情况下 ,其中 ,1 = “有一座房

子” ,0 = “没有一座房子” 。如果一座房子足够大或它的轮廓穿过了网格单元的边界 ,可

Page 19: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l5    

以用多于一个的网格单元进行记录 。 这里的关键思想是空间连续性和自定义 。 在一个场

中 ,每个位置都有一个值 (包括没有值或值为零) ,一系列值放在一起就定义了场 。这与

对象观点截然不同 ,为了完全描述一个地理对象 ,还需要给对象附加一个属性 ———一个长

方形在给它附加描述性的属性值以前 ,它不表示具体的地理实体 。

栅格数据模型是记录场的一种方法 。在该模型中 ,场的地理变化用完全相同的 、形状

规则的像元表示 。地表通常被记录为高程值的规则格网 (一个数字高程矩阵) 。另一种方

法是应用不重叠的三角网形式的面对象 (称为 “不规则三角网” 或 TIN) 表示同样的场变量 。在 TIN 中 ,每个三角形的顶点被赋予该位置上场的值 。在早期的 GIS 中 ,特别是制

图应用中 ,通常用地形图中熟悉的等高线 ,数字化地记录地面高程的场值 。这是一个用重

叠的面对象表示的场 ,封闭在各个等高线内的面积是景观的一部分 。重要的一点是 ,场可

以用栅格或矢量方法数字化地进行编码 。

最后 ,另一种类型的场由类别变量 (categorical variable) 值的连续覆盖组成 。每个位

置都有一个值 ,但 “值” 是现象的名称 。如土壤类型地图 ,每个位置都有一种土壤类型 ,

因此具有空间连续性 ,也有涉及土壤类型的自定义 ,因而这是一种场的观点 。 其他例子

有 ,如土地利用地图 ,甚至是对某开发项目适宜或不适宜的一个简单面积图 。在文献中 ,

这类场变量经历了不同的名称 ,其中包括 k‐色图和二值图 。一个日渐流行的术语是类别覆

盖 ,它表示由类别变量组成的一个场 。重要的一点是 ,这样的类别覆盖可以用矢量或栅格

方法进行数字化编码 。

选择所用的表达方法

在实践中 ,鉴于有两种类型的地理实体表达方式 ,所以思考在 GIS 数据库中所模拟的现实世界元素 ,并区分相同实体在地图上的可能表达方式是有用的 。首先 ,现实世界中有

这个元素 ,我们称之为 “实体” 。其次 ,在数据库中有对该元素的表达 。在数据库理论中

称为 “对象” (场是一种类型的对象 ,这容易令人产生混淆) 。显然 ,在现实世界中 ,把什

么看作实体依赖于具体应用 ,但为了更清楚地表述 ,一个实体必须是 :

(1) 可识别的 。如果不能看到它 ,那么就不能记录它 。

(2) 有意义的 。它必须是感兴趣的 。

(3) 可描述的 。它必须具有可以记录的属性或特征 。

正式地 ,实体被定义为现实世界中感兴趣的现象 ,该现象不能进一步地细分为同类现

象 。一个路网可能被认为是一个实体 ,并被细分为称为 “道路” 的组成部分 ,这些组成部

分可以进一步细分 ,但不能称之为 “道路” ,可以认为它们是 “路段” 或类似的名称 。同

样地 ,一个森林实体可以被细分为称作 “立地” 的更小区域 ,相应地 ,立地又由单个的

“树” 组成 。

对象观点与场观点之间的关系源远流长 ,可以追溯到古希腊对现实世界本质的哲学论

辩 :空间是现象的一个连续变化场 ,还是充满不同对象的空容器 ?从目前的情况来看 ,你

现在应该明白 ,关键问题不是哪种观点是正确的 ,而是为手头的任务选择采用哪种观点 。

一个拥有 GIS 并关注设施管理的公司 ,如个体建筑物 、公路 ,或者其他基础设施 ,几乎肯

Page 20: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l6     地理信息分析

定地认为对象观点是最适合的 。相比之下 ,环境危险物分析系统的开发者可能会采用场观

点 。环境科学中的很多理论倾向于采用场观点 ,如温度场 、风速场 、高度场等 。类似地 ,

从遥感平台采集的数据为连续性栅格数据 ,因此应用场观点是更为显而易见的方法 。

不但明确区分实体及其在 GIS 数据库中的表示 ,同时区分这两者和同一实体在地图上

的显示方式 ,这也是一个好主意 。地图中表达的内容与现实世界是不一样的 。地图设计的

目标是视觉上的 ,即显示给地图用户关于现实世界的一些东西 ,而数据库的目标是关注管

理 、测度 、分析和建模 。当选择如何用数字化形式表达现实世界时 ,值得我们清楚地区分

这些目标 。

空间对象的类型

不同实体的数字化表达要求选择合适的空间对象类型 ,而且有许多定义一般空间对

象类型的尝试 。一个被多次改进的通常方法是基于所关注对象的空间维度 。 想想你能画

出多少种对象类型 。你可以标记一个点 ,它是一个没有长度的对象 ,也可以认为它有一

个空间维度或长度 ——— L的零次幂 ,表示为 L0。你可以划一条线 ,它是一个具有与任何

简单长度相同空间维度的对象 ,即 L1。 你也可以画一个面 ,它是一个空间维度为长度

的平方 ,或 L2的对象 。 最后 ,你可以用标准制图或传统的艺术手法表达一个体 ,其空间维度为长度的立方 ,即 L3

。 美国数字化制图数据库国家标准 (DCDSTF , 1988) 和

Worboys的平面空间对象通用模型 (Worboys , 1992 , 1995) 都用类似的术语综合定义

了空间对象 。

练习 :对象和场的解码

(1) 找到你家乡地区的一幅比例尺为 1 ∶ 50000 或更大的地图 。研究该地图 ,对地

图所表达的至少 10种实体类型 (记得地图已经是一种表达) ,列出它们是否能最好地编

码为一个对象或者场 。如果实体被视为一个对象 ,说明它是点 、线 ,还是面 。

(2) 如果要求你为数据模型提出一个初步的规范 ,使得制图部门能利用一个保存在

数据库中的电子版 “再现” 该地图 ,你需要记录多少对象 (所有类型) 或场的实例 ?

提示 :利用图例 。当然 ,对于该问题 ,正确答案不唯一 。

1畅3   一 些 困 难

至此为止 ,我们介绍的关于现实世界的观点似乎是简单的 ,并且是故意如此 。现在 ,

介绍其中存在的诸多困难 。在每一种情况中 ,我们的视角是地理信息分析者的视角 ,而且

要问的关键问题是 ,他们在多大程度上对分析结果有影响 。

对象并不总是如它们所呈现的那样

学生通常会混淆各种不同的传统制图表示方法和对象与场的根本性质 。例如 ,地图上

Page 21: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l7    

的一条线可能用于标记一个面的边界 ,但实体仍是一个面对象 ;真正的线对象表示线实

体 ,如铁路 、公路和河流 。在地形图上 ,通常用等高线表示海拔这一连续性场变量 ;然

而 ,正如我们所讨论的那样 ,可以用许多不同的方式在地图上表示场 。

对象通常是多维的

空间对象常常具有比定义它们的单一维度更多的维度变化 。 例如 ,我们可以在二维

空间中通过 (x ,y) 坐标定位一个点对象 ,但在许多应用中 ,把它记录在三维空间 (x ,y , z) 中会更好 ,其中把深度或高度作为第三维度 。地质学家研究的岩体存在于一个位

置的某深度内 ,但也具有如孔隙度或颜色等属性 ,感兴趣的问题将会是属性如何在空间

(X ,Y ,Z) 中变化 。许多 GISs不易处理这些数据 ,因此经常需要额外记录固定在某位

置 (x ,y) 处某一对象的另一种属性 。这可能使得在三维空间下 ,相当自然的查询和分

析难以使用 ,或甚至是不可能的 。 Raper (2000) 提供了很多关于地理对象多维性质的

实例 。

对象不移动或不变化

至此 ,我们介绍的关于现实世界的观点是静态的 ,除了作为对象的一种属性外 ,没有

涉及时间概念 。这对有些问题很好 ,但在很多应用中 ,我们的主要兴趣是事物如何随时间

变化 。标准的 GISs不容易做到既处理空间维度又处理时间维度 。稍许思考就会发现纳入

对象的时间因素可能产生的问题 。我们称随时间变化的现象为 “过程” ,它对大多数科学

研究非常重要 ,然而却不容易在任何对象的描述中都纳入它 ,要在数字化环境中对其进行

处理 ,将永远是困难的 。 该问题已经讨论了很多年 [见 Langran (1992) 和 O摧Sullivan(2005) 关于其研究进展的综述] ,但据我们所知 ,还没有商业的时态 GIS 。在研究中曾有很多尝试 ,比如 PC‐RasterTM (Wesseling et al畅 ,1996) ,几乎所有尝试都涉及一些描述时

间和空间变化的通用语言的定义 。

对象没有简单的几何结构

我们想要刻画的地理现象的某些方面 ,不能很好地用栅格/矢量或对象/场观点进行描

述 。最明显的例子是交通网络或河流网络 。一个网络通常模拟为一个线对象集合 (路线)

和一个点对象集合 (交通结点) ,但该数据结构在许多应用中使用非常不方便 ,并且要刻

画得好也很困难 (想想单行道 、限制转弯 、车道等) 。另一个变得越来越重要的例子是图

像数据 。 GIS 中的图像可能是用作背景的扫描地图 ,或者是用标准格式编码的一张照片 。

在具体细节上 ,图像用栅格方法进行编码 ,但理解它们的关键是 :除了能在图像上定位一

个光标外 ,属性值本身不易提取 ,而且单个像素的值也不重要 ,重要的是图像整体 。在

ArcGISTM的最新版本中 ,其中的一些复杂性通过 5种地理表达进行识别 ,分别为位置 、特

征 (由位置组成) 、表面 (场) 、图像和网络 (Zeiler ,1999) 。由于地理信息分析变得越来

Page 22: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l8     地理信息分析

越复杂 ,并且扩展到所采用的基本开发框架包括了甚至还没有考虑到的应用 ,这个问题很

可能更重要 。

对象依赖于分析的尺度

不同的对象类型可以在不同尺度上表示相同的现实世界现象 。 如在每天的上班旅程

中 ,我们中的一位习惯于由铁路抵达伦敦的一个叫 Euston 车站的实体 。在一种尺度上 ,

这可用地图上的一个点很好地表示 ,它反过来又是可以用坐标 (x ,y) 进行数字化表示的点对象的一个实例 。 放大一些 , Euston 车站变为一个面对象 ,由定义了一个多边形的

(x ,y) 坐标的闭合环表示 。再放大一些 ,我们看到一个铁路线网络 (一个线对象的集合)

和一些建筑物 (面对象) ,所有这些都将由一个更复杂的数据来表示 。显然 ,同样的实体

可以用几种方式进行表达 。这是地理信息分析中多尺度表达问题的一个例子 。其主要后果

是 ,在设计地理信息数据库并装入感兴趣的对象时必须要考虑到这个问题 ,至关重要的是

所选择的表达类型允许完成预期的分析 。如下一个练习所示 ,对于从同一数据库中产生的

任何地图 ,这也是正确的 。

尺度和对象类型

通过你的网络浏览器 ,我们可以用一个来自英国的例子 ,方便地说明该思想 。该练

习也可以用纸质地图 ,或是从其他国家的测绘机构通过网络传输得到的地图完成 。

(1) 访问 www畅 ordnancesurvey畅co畅 uk 。屏幕上有一个 “Get‐a‐map” 的链接 ,点击

该链接并在弹出窗口上点击 “ I want to Get‐a‐map now !” ,然后在输入框内输入

“MaIDWell” (不带引号) 并点击 “GO” ,MaIDWell 是英国 Midlands 的一个小村庄 。

这样 ,你便进入一个从 1 ∶ 50000地形图中提取得到的围绕该村庄的一个区域 。

(2) 地图的左边是一些标有 “ + ” 和 “ - ” 的 “气球” 。如果你用鼠标浏览它们 ,

你将看到每个气球对应于该区域不同比例尺的地图 ,分别为 1 ∶ 25000 (5级缩放) 、 1 ∶

50000 (4级缩放) 、 1 ∶ 250000 (3 级缩放 ,有 “微尺度” 和 “简化的微尺度” 两种形

式) 。

(3) 该练习很简单 。 做一个表 ,表中的列为 5 种地图比例尺 ,行为感兴趣的实

体 ———我们建议有 “道路” 、 “房子” 、 “酒吧” (有一个是相当不错的) 、 “河流” 和 “地

表高程” ;为表中每个单元输入一个代码 ,以说明特征是如何被描述的 。如果用如下代

码 ,可能会对您有所帮助 ,如 P (点特征) 、 L (线特征) 、 A (面对象) 、 F (场) 和在

那个比例尺上不存在的特征 X 。

(4) 关于多尺度表达 ,这告诉你什么 ?

国家测绘机构的 CEO们都明白他们的成本 。即 ,不是从原始数据库的设计目的出

发 ,而是想从单一数字地图数据库生产不同比例尺的地图 ,那几乎是不可能的 。

Page 23: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l9    

对象可能具有分形维数

一个更复杂的情况是 ,一些实体是分形的 ,不管我们如何缩放 ,它们具有同样的或相

似的细节 。除非我们接受描述仅仅是一个特定精度上的快照 ,否则数字化地描述分形是困

难的 。一个经典的例子是线性特征 ,比如海岸线 ,不管我们如何接近地去测量它 ,它的

“褶皱” 保持不变 。无论我们如何精确地记录空间坐标 ,都不可能捕捉到所有细节 。一个

颇为意外的结果是 ,当处理不规则的线时 ,我们越是更 “精确地” 测量他们 ,它们的长度

似乎越是增加 !

试想 ,用设置为 10km 的一幅两脚规测量新西兰北岛的一部分海岸线 ,如图 1畅1 (i)所示 。我们称两脚规的间隔为 “码尺” 。当码尺为 10km 时 ,得到 18段 ,这种情况下的海

岸线长度为 18 × 10km = 180km 。 用 5km 的码尺重复该过程 ,图 1畅1 (ii) 所示 ,得到 52

段 ,海岸线长度为52 × 5km = 260km 。 最后 ,用 2畅5km 的码尺 ,得到的海岸线长度为

132 × 2畅5km = 330km 。我们看得越近 ,海岸线越长 。 如果我们用 1km 或 100m 的码尺 ,

将会发生什么 ? 100mm呢 ?该海岸线的 “实际” 长度是多少 ?

图 1畅1  确定部分新西兰海岸线的分形维数

分形维数是解决该困难的一种数学思想 。虽然它由 Mandelbrot (1977) 推广 ,但线长

度随尺度变化的思想在数学中广泛传播以前就已经被发现 (Richardson , 1961) 。分形是

Page 24: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l10    地理信息分析

分数和维度的一个简化表述 ,并表达了线可能介于 1维和 2维之间的思想 ,比如分形维数

为 1畅2或 1畅5 。对象维度的一种理解是 ,它表达了在通过计数更小码元 (这里是码尺) 进

行测量的情况下 ,当更小码元的线性尺寸 (或分辨率) 变化时 ,其外观尺寸 (这里是长

度) 如何变化 。一个简单的非分形 1维或 2维实体的尺寸 ,如通过计数子码元进行测量 ,

会随着其维度而增加 。因此 ,如果我们把码元的大小减半 ,则一个简单直线中的码元个数

将翻倍 。如果我们把立方体码元的维度减半 ,则一个大体积的物体内的立方体码元个数将

增加八倍 。如果两次测量中码尺的线性维度是 L1和 L2 ,对应的码尺数分别为 N1和 N2 ,

那么分形维数 D为

D =log(N1 /N2 )log(L1 /L2 )

(1畅1)

该定义不限定 D为整数值 ,它可用于估计一个不规则形状实体的分形维数 。图 1畅1 (iv)显示了双对数理查德森图 (Richardson plot) 上每一个码尺长度和码尺数的关系 。大致在

1条直线上的 3个点给出了分形维数 ,直线的负斜率通过简单线性回归拟合得出 。在本例

中 ,我们得到的分形维数估计值为 1畅44 。实际上 ,我们仅对海岸线本身能进行正确地测

量 ,因为任何数字化的存储表示都有一个极限分辨率 ,比如开始我们说的地图 ,在该分辨

率下 ,只要我们把两脚规的间隔设置得更小 ,线的长度就会变为固定值 。但是 ,码尺长度

和码尺数之间的关系往往在好几个数量级上才是稳定的 ,于是 ,我们可以从大尺度上的对

象描述中估计一个实体的分形维数 。

自己动手做

通常 ,理解的最好方法是自己动手做 。

(1) 找一幅比例尺约为 1 ∶ 25000或 1 ∶ 50000的适当详细的地形图 ,并选择一段长

度的河流作为研究对象 。显然 ,由于我们对线对象的弯曲度感兴趣 ,因而选择一条蜿蜒

曲折的河流是明智的 。 20km 的长度大约是适宜的 ,且工作量不会太大 。

(2) 现在 ,为两脚规设置一个较大的间隔 ,比如相当于地面实际距离 1km ,并沿着

河流 “行走” ,数一下走的步数 。记下码尺长度和对应的分段数量 。

(3) 用长度折半的码尺重复进行 ,即应用长度相当于地面实际距离 500m 的码尺 。

(4) 重复该过程 ,直到码尺短到不能继续进行实验 。现在 ,你应该有一张数值表 。

(5) 把分段数量和码尺长度转换为对数值 ,并做图 ,纵轴是分段数量的对数 ,横轴

是码尺长度的对数 。如果能用电子表格 ,你会能很容易做到这一点 。点应该大致落在一

条直线上 ,虽然并不能保证成功 。

(6) 最后 ,使用电子表格 (或一个平尺和敏锐的观察力) 为数据拟合一条最佳直

线 ,并估计河流的分形维数 。

那么 ,所有这些意味着什么 ?一条线的分形维数的最简单解释是作为线的 “弯曲度”

或 “褶皱度” 的测度 。一个实体的分形维数表明它在多大程度上从它的拓扑维度填满下一

维度 。线有一个单一的拓扑维度 L1。分形维数为 1畅0的线 (注意小数点) 是一条理想化的

线 ,不占据两维度中的空间 。但是 ,分形维数为 1畅1 或 1畅15 的线 ,开始填充平面的两个

维度 。地理学中的许多线性特征都具有大约在 1畅1和 1畅5之间的某个分形维数 。

Page 25: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l11   

通过计数在不同线性分辨率下所包含的元素个数 ,可以用理查德森图的变体估计面对

象和体对象 (或表面) 的分形维数 。在这方面 ,关于城市发达地区的分形维数计算 ,有大

量已完成的工作 (Batty and Longley , 1994) 。 虽然一个完全光滑的表面具有分形维数

2畅0 ,但一个粗糙表面的分形维数或许是 2畅3 。通常 ,表面形貌的分形维数可能与其他特征

有关 。地理现象中其他分形维数的例子还有 ,如土壤的 pH 值断面 、 河流网络

(Burrough , 1981 ; Goodchild and Mark , 1987 ; Lam and De Cola , 1993 ; Turcotte ,1997) 。

分形的概念与尺度的概念密切相关 。一些研究者试图在制图综合中应用它 ,但结果好

坏参半 。应该明确的是 ,分形维数是一个指标 ,它揭示对象如何随着尺度和综合的变化而

变化 ,并且一般而言 ,现象的尺度变化特性可能与它们的分形维数相关联 (Goodchild ,1980) 。最近有人提出 ,估计数字化数据的分形维数可以帮助确定原地图的比例尺

(Duckham and Drummond ,2000) 。

对象可能是模糊的和 /或具有不确定性的边界

前面的讨论 ,假设我们处理的对象严格来说是明确的 ,并且如果它们有一个空间范

围 ,原则上可以准确地确认其范围 。但我们想要描述和分析的许多空间对象是不明确的 ,

而且有的还可能具有不确定性边界 ,典型的例子是土壤类型 。在地图上 ,土壤类型用互不

重叠的多边形表示 ,用绝对分明和固定不变的线分割调查者识别出的不同土壤类型 。这是

3畅7节所讨论的 k‐色图的一个例子 ,但如所有土壤调查者所知 ,这实际上是不符合实际

的 ,这有可能有两方面的原因 。

首先 ,虽然土壤类型可以改变得非常突然 ,这样可以在地图上画一条线明确划分不同

的土壤类型 ,但它也可以从一种土壤类型缓慢地变化到另一种类型 ,这样不同土壤类型之

间就没有确定的界线 。可靠的土壤调查者通常用一个点划线标记这种边界的不确定性 。在

GIS 和随后的空间分析中 ,这种不确定性常常用一种简单的方式进行处理 ,即 ,假设分割

线实际上是确定的 。其他学科中也出现同样的问题 ,如地质学中的岩石类型是渐变的 ,市

场中一些贸易区的边界可能是不确定的 ,以及当描述意念地图时也是如此 。每个伦敦人都

知道城市的一部分叫 “Soho” ,但这并没有确切依据 ,大部分人都难以确定 Soho从哪里开始到哪里结束 。同样在伦敦 ,“Westminster” ① 就有确切依据 ,因此原则上有一个确定的边界 ,

但我们怀疑许多伦敦人都知道这一点 ,却反而用与 Soho 大致相同的不确定性去想象Westminster 。为了增加复杂性 ,就 Soho和一些土壤类型而言 ,对象边界的一部分可能是不

确定的 ,但其他部分可能是确定的 。处理这种边界不确定性的一种可能方法是 ,为每一位置

上所定义类型的成员赋予某一概率 ,因此不是说 “在这里 ,都是这样或那样的土壤类型” ,

地图和数据会告诉我们 “ (比如说) 有 70% 的概率 ,这里的土壤是这样或那样的类型” 。

其次 ,对象可能是模糊的 ,再次用土壤类型做最好的说明 。我们说给定土壤属于一种

特定的土壤类型 ,也就是断言该土壤类型 (或集合) 本身是确定的 ,意思是我们可以明确

① 威斯敏斯特 ,伦敦市的一个行政区 ,英国议会所在地 。 ——— 译者

Page 26: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l12    地理信息分析

地说出该土壤是否真的是那种类型 。然而 ,一些集合可能不服从这种指派 ,因此所有我们

能说的是 ,给定的土壤大抵是某种特定的类型 ,即用一个在何种程度上可能属于某特定土

壤类型的数值来代替我们的不确定性 。这与上述讨论的边界不确定性不一样 ,其中土壤类

型本身有几种是确定的 ,但给定的土壤属于哪一种类型却是不确定的 。在这里 ,我们对土

壤本身的类型不确定 ,但在某种意义上说 ,对土壤属于哪种不确定性类型是确定的 。实际

上 ,任何给定实体在多大程度上是这种模糊集合的成员 ,通常可以用 0 ~ 1的一个 “隶属

度” 值进行说明 。这可能会与不确定性边界的概率相混淆 。通过下面的思考练习 ,或许能

帮助你区分这两种类型的不确定性 。

思考练习 :确定性与不确定性

考虑下面的层级描述 :

约翰的身高超过 1畅8m 。

这是一个确定的描述 ,约翰是一个明确集合中的一员 ,该明确集合由所有身高超过

1畅8m 的人组成 。

我认为约翰的身高超过 1畅8m 。

该集合仍然是明确的 ,但关于集合中约翰的成员我们不确定 ,并可以给我们的不确

定性赋予一个概率 。这与不确定性边界问题类似 。

约翰是高的 。

“高” 是一个模糊集 ,但我们确定约翰属于该集合 。现在是模糊范畴 “高” 概括了

该不确定性 。也有可能约翰属于模糊集 “非常高” 或 “一般高” (虽然可能不在所有这

三个模糊集中 ,但他们现在覆盖了相当大的范围) 。对于任何特定的身高 ,我们可以为

这些集合赋予一个隶属度值 ,以说明有多么地 “高” 、 “非常高” 或 “一般高” 。如果约

翰的实际身高是 1畅9m ,那么他在集合 “高” 中的隶属度可能是 1畅0 ,在集合 “非常高”

中可能是 0畅6 ,在集合 “一般高” 中可能是 0畅05 。这是模糊性问题 。

我认为约翰非常高 。

关于约翰的描述 ,它把两种类型的不确定性合并成了一个 。

现在思考如何把同样的描述转换为空间例子 。对于简单的测算 ,如在几秒钟之内可

从 GIS 中提取的给定土壤的总面积 ,两种不确定性类型的含义是什么 ?

1畅4  属性描述的尺度

除了点 、线和面对象的类型划分之外 ,我们还需要一种为空间定位对象赋予属性值的

方法 。由于描述事物的可能方式受限于我们的想象力 ,所以属性值的可能范围是庞大的 。

例如 ,可以通过高度 、颜色 、年代 、用途 、租金 、窗户数量 、建筑类型 、所有权等等描述

建筑物 。正式地说 ,属性是所要选择表达的实体的任何特性 。在本节中 ,我们将基于量测

尺度探讨一种简单的属性分类方法 。量测尺度通常是选择分析方法的一个限制性因素 ,并

最终影响对该属性空间结构研究结果的推断 。

Page 27: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l13   

重要的是要明确什么是测度 。当收集信息后 ,测度是根据某些集合规则 ,为观测到的

现象赋予一个等级或数值的过程 。该定义并没有明确限定我们的赋值是否包含数字 。该定

义也包括把现象分为类型 ,或分为一个假定等级下彼此具有相对顺序的等级 。你正在读的

这本书可以赋值为称为 “书” 的一般对象类别 ,你可以在某一规则下与其他书进行比较排

序 ,分为好 、中等或者差 。很明显 ,当我们感知 、评价和记忆关于外界的信息时 ,这种测

度的观点描述了在我们头脑中 ,实际上几乎总是在思考的一个过程 。

如果这个过程要产生有用的测量尺度 ,那么有必要坚持使用一个可定义的过程进行量

测 ,给出尽可能有效的和具有可重复性的结果 。第一个要求意味着量测者知道自己在量测

什么 ,并能进行必要的操作 ;第二个要求意味着尺度是真实和准确的 ;第三个要求意味着

重复该过程会产生同样的结果 ,并且当应用不同数据时得到类似结果 。如果不满足这些要

求 ,由此得到的量测结果在任何 GIS中的作用将会是有限的 ,或者说为了有效利用它们 ,

无论如何我们需要有关不满足这些测量尺度要求时的良好信息 。总之 ,我们必须要知道所

测度的是什么 ,必须有一个预定义尺度 ,以及必须使用一套统一的规则进行控制 。

有时为了得到属性数据 ,需要测度什么是显而易见的 ,但在其他时候 ,我们感兴趣的

是对不易量测 ,并且也不存在达成一致的量测规则的概念进行分析 。当感兴趣的概念本身

含糊不清或有多种可能解释时 ,这是最常见的 。如应用 GIS 对一个区域的人口密度进行制图很容易 ,但因为它涉及人们的反应 、生活水平和可利用的资源 ,所以不能简单地用人口

密度来量测人口过剩 。注意 ,只要重视所面临的困难 ,这些思想并不阻碍基于我们的认

识 、观念等创建量测方法 ,并因而承认 GIS 在处理定性数据方面的进展 。

定义现象所赋予的名字 、等级或数字的规则 ,确定了所谓的量测尺度是什么 ,不同量

测尺度与不同的规则有关 。 Stevens (1946) 设计了量测尺度的一个有用分类 ,包括 4 种

———名义量 、次序量 、间隔量和比率量 。

名  义  量

因为没有关于所赋予属性值的相对性假设 ,名义量是 Stevens分类中的最低层次 。其中 ,

每个值是一个用于标记或命名现象的不同类别 。我们称之为 “商店” 的某些建筑 ,如果把它

们称为 “类别 2” ,并没有什么信息损失 。唯一的要求是类别为相容的或互斥的 。相容的意味

着必须能够把所有对象分配到某一类别或其他类别 ( “商店” 或 “非商店”)。互斥的意味着

不应该有对象被分配到一个以上的类别中 。没有顺序或类别之间差异的假设 。在名义量数据

中 ,所用的任何数字仅作为符号 ,不能对其进行有意义的数学操作 ,这限制了可以对它们进

行的运算 。即便如此 ,我们仍然可以计数类别成员中的数量 ,形成频率分布 。如果实体在空

间上分布 ,可以制作关于它们的地图并对它们的位置坐标 (x ,y) 执行运算 。

次  序  量

对于名义量 ,除了它们的互斥性外 ,类别之间没有隐含关系 。如果根据一些标准能对

类别进行一致性排序 ,那么我们就有了一个次序量量测尺度 。一个例子是根据农业生产潜

Page 28: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l14    地理信息分析

力把土地分为可能的类别 。根据一个假定的等级 ,我们知道等级的顺序 ,但不知道顺序之

间的差异 。因此 ,第一类和第二类之间的差异也许与第九类和第十类之间的差异非常大 。

如名义量数据一样 ,对于次序量 ,不是所有的数学运算都有意义 ,但对于一些没有假定差

异规则的统计处理是可能的 。

通常把名义量和次序量称为 “分类数据” (categorical data) 。

间隔量和比率量

除了顺序 ,量测尺度中的间隔量用固定的等间隔定义了类间差异或距离 。温度计通常

衡量一个间隔等级 ,以保证 ,比如说 25 ℃和 35 ℃之间的差异 ,与 75畅5 ℃和 85畅5 ℃之间的

差异是相同的 。但是 ,间隔量缺乏真零值 ,因而仅能用于量测差异 ,没有绝对或相对的大

小 。比率量具有真零值 ,0m的距离确实意味着没有距离 ,不像间隔量 0 ℃ ,它不意味着

没有温度 。出于同样的原因 ,6m是 3m 的两倍 ,而 100 ℃不是 50 ℃的两倍那么热 。

如果计算两个量测尺度的比值 ,通过对比可以阐明该区别 。如果地点 A 到 B 的距离为 10km (6畅2137英里) ,到 C的距离为 20km (12畅4274 英里) ,那么不管采用什么样的

距离单位 ,距离之间的比值是

距离 AB距离 AC =

1020

≡6畅213712畅4274

≡12

(1畅2)

距离从根本上说是一个比率量尺度 。间隔量不能以同样的方式保留这样的比值 。如果地点 B的年均温度为 10 ℃ (50 稠 ) ,地点 C为 20 ℃ (68 稠 ) ,我们不能说 C地是 B地的两倍热 ,因

为比值依赖于我们的测度单位 。用摄氏度时 ,它是 20/10 = 2 ;用华氏温度时 ,它是 68/50 =

1畅36 。尽管存在这种差异 ,间隔量和比率量通常可以用相似的方法进行数学上和统计上的处

理 ,因此常常把它们放在一起 。同时 ,称它们为 “数值尺度” (numerical measures) 。对于制图和分析而言 ,虽然是在某一量测尺度上收集数据 ,但把它们转换为一个低层

次上的量测尺度通常是可能的和方便的 。间隔量和比率量可以转换为次序量 ,比如高/低

或者热/不冷不热/冷 。一般而言不可能的是 ,在一个层次上收集数据 ,而把它们看作是在

更高层次上收集的数据 ,并试图对其进行制图和分析 ,如试图为次序量添加分值 。

重要的是要注意 ,并非每个人都信服 Stevens关于量测尺度的分类方案 。 Velleman 和Wilkinson (1993) 指出 ,仅因为属性数据的量测尺度看起来不支持 ,而排除若干类型的

分析 ,这或许是不必要的限制 (他们也指出这不是 Stevens的本意) 。一个很好的例子是名

义属性 ,例如一个县的 ID号码 ,似乎与另一个感兴趣的变量有某些关系 。在空间编码方

案中 ,通常有一个空间模式的编号 ,可能是从东到西或从北到南 ,或从城市中心向外围 。

在这种情况下 ,很可能发现理论上的名义属性 (ID 号) 与其他一些变量之间的关系 。当

然 ,这种情况下重要的是 ,必须确定这种关系背后的原因是什么 ,而不是简单地说邮政编

码与犯罪率相关 !

后来 ,Stevens自己增加了一种对数间隔尺度 ,用以包括诸如地震强度和 pH 值 ,其

尺度间的间隔基于幂规律增大 。再后来 ,Chrisman (1998) 指出 ,在 GISs 中有许多类型的属性数据不适合用这一分类 。如许多类型的线对象最好是用宽度加上方向表示为一个矢

Page 29: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

第 1章 地理信息分析与空间数据 l15   

量 ,以及我们经常提到的周期性尺度 ,比如角度 ,每隔 360°重复一次 。 关于量测尺度方

法 ,这些批评所强调的重要原则是 ,最好始终用开放的心态进行调查 。尽管如此 ,名义

量 、次序量 、间隔量和比率量的分类方案在考虑可能的分析时仍然有用 。

量纲和单位

除了量测尺度外 ,属性还具有量纲 (dimensionality ) 特征 ,并与相关的尺度单位

(scale of units) 关联 。如果我们把水流描述为线对象 ,可以考虑的重要变量包括速度 、截

面面积 、泄流量 、水温等 。这些变量是所谓的某些量纲的变异 。量纲的选择依赖于研究者

感兴趣的内容 ,但很多科学问题中 ,它往往可以简化为三个基本量纲的组合 ,即质量 、长

度和时间 ,分别用 M 、 L和 T 表示 。如速度的量纲是距离 L除以时间 T ,或者表示为 L/T 。无论速度单位用英里每小时还是用米每秒表示 ,这都是正确的 。 L T - 1是长度除以时间

的另一种写法 。

类似地 ,截面面积可以写为两个长度量纲的乘积 ,或 L2。泄流量是单位时间 T 内水

流的体积 L 3,量纲为 L3 T - 1

,等等 。无量纲变量是重要的一类 ,它们的值独立于所涉及

的单位 。如用弧度测量的角度 ,是弧长和圆半径两个长度的比值 ,其量纲相互抵消

(L L - 1= L0

) 导致生成无量纲 。一类重要的无量纲值的来源是观测记录为一些固定总数的

比值 。如在某一普查区内 ,白人人口的比例是一个无量纲的比值 。

量纲分析是任何应用工作中一种非常有价值的方法 。因为方程必须要数值平衡和量纲

平衡 ,该方法可用于检查方程中没有考虑到的变量 ,甚至可以帮助提出正确的函数关系的

形式 。令人惊讶的是 ,地理学家对量纲分析兴趣不大 ,这或许是因为人们在大量的地理工

作中没有发现明显的基本量纲 。然而如 Haynes (1975 , 1978) 所述 ,没有什么可以阻止

诸如 P ( =人口数量) 或 $ (= 钱) 等标准量纲的使用 ,并且这种使用可能常常会暗示方

程的可能形式 。

最后 ,间隔量和比率量属性与单位的一种固定尺度有关 ,通常用标准的尺度给每个量

纲赋予数值 。纵观历史 ,有许多单位系统用来描述相同的量纲 。如在距离测量中 ,利用了

“英国的” 或英制单位 (英寸 、 英尺 、 英里) ,公制单位 (米 、 千米) 和其他传统单位

(掌 、杆 、测链 、海里) ,这给人一种扑朔迷离 、混乱的基本单位和导出单位使用状态 。虽

然许多系统的使用与日常生活相关并且通常是方便的 ,但在科学中它们不尽如人意 ,并可

能变得混乱 。美国宇航局在 1998年为此付出了巨大代价 ,当时用于测量火星引力加速度

的单位系统使用混乱 ,为火星气候探测者号的任务执行带来灾难 。

思考练习 :生活中的空间数据类型

查看图 1畅2 ,它试图对我们所讨论的几何对象类型进行交叉列表 ,得出 12种可能的

空间数据类型 。

现在 ,我们想让你思考一下我们所讨论的比较抽象的概念 。

在你的日常生活中 ,你在什么类型的空间对象之间穿梭 ?例如 :

瞯你的房子是一个点对象 、一个面对象 ,或者都是 ?

Page 30: GEOGRAPHIC INFORMATION ANALYSIS€¦ · 1981),那是本书的作者之一在约30年以前写的一本小册子。其第一个关键思想是在长度 维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图

l16    地理信息分析

图 1畅2  实体 属性空间数据类型示意图

瞯你上班 、去学校和学院的道路是一个线对象吗 ?可能用什么样的属性来描述它 ?

瞯你是一个点数据类型名义量吗 ?或者你是一个时空 (因此是四维) 线对象吗 ?

瞯对你所提出的这些 (和其他) 空间对象的属性 ,用什么样的量测尺度描述它们是

合适的 ?

这些问题的答案 ,体现了实体 属性框架可能是多么地丰富 ,但也可能是多么地简

化的一种感觉 。当我们进一步研究空间分析时 ,记住这一点 :无论空间分析得到什么见

解 ,它始终是在现实的抽象表示上进行的 ,这些抽象表示最终可能会限制其用途 。

1畅5   GIS与空间数据操作

我们注意到 ,对数据进行空间操作的能力是 GIS与任何其他标准数据库管理系统的区别 。本节我们从地理信息分析者的角度 ,有选择地考查这些空间数据操作 。我们不打算详

细讲述所有这些操作 ,因为它们的数量非常大 ,并且其实现随系统的不同而变化 。在本节

中 ,我们展开针对它们的两种空间分析观点 。第一 ,我们阐述一种思想 ,即这些几何操作

涉及空间数据类型之间某种形式上的转换 。第二 ,我们关注应用于各种结果的 (x ,y) 坐标编码误差的影响 。

有时涉及的几何问题比较简单 ,如计算给定特征的线对象 (河流 、铁路 、需要修理的

公路) 的总长度或计算一些面对象 (林地 、特定类型的农作物) 的总面积和周长 。在其他

时候 ,关键问题是以不同方式存在的空间单位类型的交互 。如我们可以很容易地用 GIS 确定 ,一种疾病在到某些工厂或其他点对象的不同距离内有多少病例发生 。我们需要病例的

地理编码数据 ,也需要工厂等设施的地理编码数据 。以邮寄形式提供受疾病折磨的人和可

疑设施的地址 ,通常可以得到这些数据 。然后 ,我们可以对设施做某一距离的缓冲区 (比

如 1km) ,并使用点在多边形内的操作确定有多少该病的病例位于缓冲区内 。最终的结果

是一组数字 ,它记录有多少病例发生在每个工厂附近 ,有多少没有发生在一个工厂附近 。