基于關系的空間信息處理是對基于幾何的空間信息處理方式的一種有益補充,是地理信息科學、語言學、認知科學和人工智能等學科交叉的重要理論之一,在圖像智能解譯、空間數據挖掘、多源空間數據集成和空間場景知識表示等高級和智能化空間信息處理領域具有重要應用。《多尺度空間關系理論與實踐》簡要介紹空間信息幾何表現和關系表現與空間尺度的關系,重點闡述多尺度空間關系建模理論與應用,主要包括作者在拓撲關系多尺度建模理論、方向關系多尺度建模理論、定性位置多尺度建模理論與相似性問題,以及基于關系的多尺度數據分析的總體框架、多尺度數據查詢、多尺度數據一致性檢測應用等方面的研究成果。
《多尺度空間關系理論與實踐》可作為從事遙感與地理信息科學研究和應用的科技人員參考書,也可作為高校測繪、地理信息科學、遙感、計算機科學等相關專業的師生教學用書。
第1章空間信息表現與空間尺度
空間信息多尺度表示與處理是當今地理信息科學領域理論與方法研究的重要前沿,主要解決由于不同部門用戶對地理數據的不同應用需求和分析需要,而導致空間數據的不同表示問題。多尺度、多類型、多時態的空間數據是人類研究和解決人口、資源與環境等重大問題時所必需的重要信息資源,是“數字奧運”“智慧城市”“智能交通”等應用的重要數據基礎設施。
空間信息服務已成為空間信息技術社會化、實用化的核心問題,其典型代表是以Google Earth為代表的多尺度空間數據網絡服務、多尺度電子地圖自適應可視化等平臺。空間信息服務的主要問題有:①不同行業領域對空間數據詳細程度的需求不一樣,如何為用戶提供多種尺度或多種詳細程度的空間數據?②如何統一管理多種尺度或多種詳細程度的數據?③如何保證不同部門或行業生產的多尺度空間數據的一致性?④如何在多個尺度上查詢和分析不同詳細程度的空間數據?第一個問題是多尺度空間數據的生產問題,第二個問題是多尺度數據建模和管理的問題;第三個問題是多尺度數據的一致性問題;第四個問題是多尺度數據查詢、信息提取和匹配分析問題。這四個問題構成了多尺度數據的生產、管理、分析和應用等各個階段。到目前為止,針對前兩個問題已有較多研究和相關應用軟件,本書主要解決第三個和第四個問題。
1.1空間信息表現方式
空間信息表現方式是空間信息科學的基礎,主要涉及如何把地理世界中各種地理要素的幾何、屬性,以及空間關系等重要信息經過認知、加工和抽象后,科學地加以組織和表達,以利于空間信息分析處理。常用表現方式有兩類:面向計算機的幾何表現及面向認知的關系表現。
1.1.1表現方式
如圖1.1所示,空間信息可從兩個方面進行表示。一方面,為有利于計算機精確表現地理世界,必須先定義坐標系統,然后基于坐標系表達地理要素的幾何位置,采用高效的幾何數據結構進行存儲和管理。這種表現方式側重地理要素的幾何位置、幾何形態和幾何分布的表示,因此稱為幾何表現方式。另一方面,人類基于自己對地理世界的認知和理解,對地理要素的空間關系進行認知和抽象,用一些關系符號表達,并進行交流和推理。這種表現方式側重地理要素關系表達,并對每種關系賦予一個詞匯或符號表示,因此稱為關系表現方式。
(a)幾何表現(b)關系表現圖1.1空間信息表現方式
如圖1.1所示,幾何表現把地理場景抽象為由面對象a、b(由b1、b2和b3組成)和c,以及線對象d組成的對象稽核,并完整記錄了每個對象的幾何坐標位置。幾何分析可以對象幾何位置進一步進行面積、長度量算,以及分布模式推導等。關系表現則把對象間的空間關系表示為一些自然語句的集合,方便人類理解,如“d穿越a,d從b1和b2間穿過,b3和c位于d的北方,c位于b的東和東北”等。“穿越”“穿過”“北方”和“東北”等就是空間關系符號表示。
幾何表現和關系表現都是對地理世界的客觀表示,但由于出發點不同,因此差異明顯。幾何表現重在空間信息的精確表達、管理和幾何分析,因此必須嚴格定義空間坐標系統,并基于坐標系統進行描述和分析,但與人類的認知不符。關系表現重在關系概念的認知和表達,因此由定性符號系統及相關運算組成。關系表現不是一種精確表達方式,但人類有足夠的能力進行推理、理解和交流關系符號所表達的空間信息。
盡管幾何表現和關系表現間差異明顯,但它們都是重要的空間信息表現和處理方式,互為補充。高層次的空間分析和理解不僅需要幾何信息,更需要關系知識。例如,制圖綜合中,形狀化簡前后的數據需要保持拓撲一致性。因此,需要在幾何表現和關系表現間建立聯系。空間關系模型能根據對象類型,把幾何數據轉化為關系表示。不同的關系模型可以把相同的幾何數據轉換為不同的關系符號,并進行關系推理運算。
1.1.2幾何表現
為表達地理世界,幾何表現首先定義了空間坐標系統,然后把地理對象表示為空間坐標系統中點的集合。由于每個點都具有坐標,因此可測量面積、長度等定量幾何信息。對于多源數據,只要具有相同的坐標系統,就可進行集成、融合、匹配、管理和分析。
(1)空間坐標系統。GIS坐標系統是笛卡兒坐標系,由一個原點和垂直的坐標軸組成。GIS中常用坐標系主要包括平面直角坐標、地理坐標系等。地球橢球面上任一點的位置,可由該點的緯度(B)和經度(L)確定,即地面點的地理坐標值,由經線和緯線構成兩組互相正交的曲線坐標網稱為地理坐標網。由經緯度構成的地理坐標系統又稱為地理坐標系。根據地圖投影方法,可把地理坐標系轉為平面直角坐標系。
(2)空間數據模型。簡單地講,空間對象為點的集合。但由于地理要素和地理應用的復雜性,不同要素、不同應用需要不同的模型表達對象。通常可分為矢量模型和柵格模型。矢量模型是一種基于對象的表達方式,完整準確表達了每個對象的幾何位置、形狀和形態特征。柵格模型是一種基于像元的表達方式,用具有一定大小的像元近似表示空間對象,每個像元可具有屬性。影像是一種常用的柵格數據,每個像元用光譜表達地物的信息。由于影像沒有顯式表達每個對象及其屬性,因此需要對影像數據進行分析理解,轉化為基于對象的表示。
(3)空間數據管理。幾何表現將空間場景表示為對象(點、線、面)的集合,并采用空間索引技術(格網索引、四叉樹索引、R樹等)對空間對象進行高效組織,以幫助管理和快速查詢。在此基礎上,對每個對象進行符號顯示和制圖,或者進行三維場景虛擬顯示。無論是空間數據索引或可視化,都是在空間坐標系統支持下,以空間對象的幾何坐標、位置、形態為基礎的。
(4)空間幾何分析。幾何表現把空間對象表示為點、線、面以及三維實體等基本結構。基于這些對象結構,可分析對象的基本信息,如空間位置(基于空間坐標系傳遞空間對象的定位信息)、空間分布(同類空間對象的群體分布信息,包括分布、趨勢、對比等)、空間形態(空間對象的幾何形態)和空間距離(空間對象的接近程度)。把空間對象的幾何數據和屬性數據結合,可進行幾何分析和量算,如緩沖區分析、疊加分析、網絡分析等,再從空間數據中提取有用信息。
1.1.3關系表現
關系表現首先基于空間關系模型,把幾何表現中的坐標數據轉化到概念空間中的關系語言,然后基于關系語言進行關系知識的表達、管理、推理及場景分析。
(1)空間關系定位。計算機是基于笛卡兒坐標系進行對象定位的,而人類是基于關系進行對象定位的。例如,維基百科把太行山位置描述為“跨越北京市、河北省、山西省、河南省4省(市);北起北京西山,南達豫北黃河北崖,西接山西高原,東臨華北平原”。基于關系的定位把目標對象(太行山)和參照對象(用地名表示)通過空間關系關聯來進行定位。這種定位方式顯然沒有笛卡兒坐標系準確,但人們更習慣用基于關系的位置表達。
(2)空間關系模型。人類對關系的表達和抽象是自動進行的,為使計算機也具備空間關系處理能力,必須在幾何表現和關系表現間進行轉換。空間關系模型是一種數學模型,根據空間對象的幾何特征,從對象的幾何表現獲得它們的關系符號描述。其中,空間對象間存在多種類型空間關系,包括:拓撲關系、方向關系、鄰近關系、距離關系等。針對不同類型關系,有不同的空間關系描述模型,如拓撲關系的九交模型和方向關系的方向關系矩陣模型等。
(3)空間關系管理。關系表現將空間場景仍然看做對象集合,用一個關系網絡來表達。在關系網絡中,對象是沒有大小和長度的,只是表示為網絡的節點;而對象關系表示為節點間邊的屬性。因此,關系網絡可管理和表達空間場景中所有對象的關系知識。基于關系網絡,可進行空間推理、場景一致性和相似性分析等工作。
(4)空間關系分析。空間關系是定性概念,因此不能進行量化分析。距離是分析的基礎,關系間的距離是通過概念間的定性距離來度量的。不同類型對象(如線/線、線/面、面/面)、不同類型關系(如拓撲關系、方向關系)可用不同概念鄰居圖來表達任意兩個關系的距離。基于兩個關系的距離,可定義和度量兩個關系網絡的相似性,從而進行場景相似性分析。
表1.1總結和比較了幾何表現和關系表現的特點。
表1.1幾何表現和關系表現
幾何表現關系表現
定位方式 笛卡兒坐標系 基于關系的定位
定位性質 絕對定位 相對定位
定位精度 量化、精確 定性、近似
對象表現 幾何表現(點、線、面等 ) 關系知識表達、推理
空間分析 幾何計算、歐式距離等 概念距離、關系距離、場景相似
信息度量 定量處理(面積、長度 ) 定性概念表達
1.2幾何表現與空間尺度
地理世界中的各種地理現象和過程都可經過人類認知、抽象和建模,表達為空間幾何數據和屬性數據。地理信息系統主要用于存儲、檢索、操作、查詢和分析空間幾何數據(如點、線、面、空間劃分和網絡等),以及屬性數據,為空間問題或地理問題解決和決策提供服務。幾何表現提供了基本的數據類型來抽象和表達地理現象的幾何結構、關系、屬性,以及相關操作。因此,基本數據類型的定義對空間數據表達和管理非常重要。
但由于地理世界的復雜性、人類認知能力的有限性,以及分析應用需求的多樣性,同一地理現象需要在不同尺度上進行抽象和表達。度量或觀測的空間尺度在很大程度上決定了哪些現象和過程要表達、如何表達,以及哪些現象要舍棄的問題。因此,GIS或空間數據庫包含了地理現象在一定和有限尺度上的表達。為在多個尺度上創建、管理、制圖和發布地理現象的幾何表達,這就需要管理空間對象的多尺度表現。
1.2.1幾何表現模型
從對象建模的角度看,主要有兩種模型:基于對象的(entity-oriented / feature-based view)和基于場的模型(space-oriented / field-based view)。基于對象的模型主要建模和表達位置或范圍明確的地理要素,它們在空間上占據一定范圍,并且是離散的 (如道路、建筑物等)。基于對象的模型主要由三個要素組成:①空間位置;②非空間屬性 (如名稱、類型等);③運算 (如對于道路而言,其操作運算有確定道路中心線、確定道路長度等 )。空間對象一般指地理對象的空間屬性,在GIS和空間數據庫中也稱為空間數據類型。
空間對象有單個對象類型和集合類型之分。
(1)簡單點對象
(圖 1.2(a)),用坐標系中的一個點表示,主要建模和表達對象在空間的位置,而不表達對象的范圍 (如水井、電線桿、城市等 )。
(2)簡單線對象
(圖 1.2(b)),用一系列坐標串表示,不能自相交,且只有 2個端點。主要表達對象在空間上的連通性,或者對象在空間上的運動 (如河流、道路、電力線、路徑等)。
(3)簡單面對象
(圖 1.2(c)),指由首尾相同的一系列坐標串圍成的封閉區域,主要表達對象的空間范圍 (如湖泊、城市、林地、農地等 )。簡單面對象是連通的,且不能包含島嶼。
(4)復雜點對象(圖 1.2(d)),由多個點對象組成,表示一些復雜的對象。
(5)復雜線對象
(圖 1.2(e)),用一系列坐標串表示,但允許自相交,端點個數可多于 2個。
(6)復雜面對象(圖 1.2(f)),由多個簡單面對象組成,因此可以不連通,或包含島嶼。
(7)空間劃分集合類型(圖 1.2(g)),主要指把平面空間劃分為分離的面對象,每個面對象都有一個屬性,且可表示為簡單或復雜的幾何類型。一般而言,劃分類型中的每個元素不允許出現帶島嶼的面對象。例如,每個國家的行政區域劃分、土地利用分類圖等。
(8)空間網絡集合類型 (圖 1.2(h)),主要指由離散對象及其網絡連接關系組成的集合。例如,道路網絡、水系網絡等。
(a)簡單點 (b)簡單線 (c)簡單面
(d)復雜點 (e)復雜線 (f)復雜面
(g)空間劃分 (h)空間網絡圖 1.2空間數據類型
通常基于對象的模型用矢量數據結構實現,而基于場的模型主要建模和表達在空間上連續分布的地理要素 (如溫度場、氣壓場 ),通常用柵格數據結構實現。
1.2.2 幾何表現與空間尺度
多尺度數據建模和管理是多尺度應用的核心,也是當前 GIS領域研究的主要前沿問題。美國國家地理信息與分析中心 (NCGIA)從 1988年就開始關注并支持研究空間數據的多尺度表達問題 (Buttenfield,1995)。
……