地理編碼系統(tǒng)設計與實現(xiàn)

郭會,宋關福,馬柳青,王少華

(1 中國科學院地理科學與資源研究所,北京100101;2 中國科學院研究生院,北京 100039;3北京超圖地理信息技術有限公司,北京,100085)

論文來源:中國測繪學會九屆四次理事會暨2008年學術年會論文集

摘要:針對大部分的地理位置信息都采用文本方式進行描述,而非地理坐標,本文提出了地理編碼關鍵技術和實現(xiàn)方法,主要包括地址標準化、地址匹配、地理編碼量化等,并在SuperMap GIS平臺軟件中實現(xiàn)了中文和英文地理編碼功能,實驗中英文地理編碼的平均誤差率約為1%,證明了本文…

關鍵詞: 地理編碼;地理信息系統(tǒng);地址模型;地址標準化;量化

1 地理編碼概述

地理編碼也稱地址匹配,是指將地址映射成地理坐標的過程,提供了一種把描述成文本地址的地理位置信息轉換成地理坐標的方式[1]。計算機無法通過文字敘述直接找到目標位置,無法直接獲取其具體的經緯度坐標。例如,用“北京市海淀區(qū)復興路11 號 ”來表示中國中央電視臺的位置,計算機無法僅從“北京市海淀區(qū)復興路 11 號” 獲得中央電視臺的具體坐標位置。地理編碼可以利用地址數(shù)據(jù)庫來建立地址與地理坐標空間的對應關系[2]。地理編碼是各種算法程序的集合,主要采用結構化的數(shù)據(jù)模型,將各種興趣事件或者現(xiàn)象的文本地址與地址數(shù)據(jù)庫進行匹配[3]。

隨著 GIS 在人們的生產生活中的作用越來越重要,對于根據(jù)文本地址快速、準確的查找其地理坐標的需求日益明顯。在互聯(lián)網服務領域,基于位置的服務被越來越多的應用,采用地理編碼技術,地圖搜索引擎和地圖服務網站的準確度和響應速度將得到提高(如圖 1);在公共服務領域,緊急情況下獲得的地址往往是不完整的、甚至是不準確的,而需要計算機系統(tǒng)快速、準確定位;SARS 期間,有關單位每天上報的新增病例信息中,也包括描述性住址,若要進行流行病學分析,就需要獲取其坐標位置[0]。通過地理編碼,可以實現(xiàn)原有信息系統(tǒng)和空間信息的融合,將日常的經濟、社會、人文、歷史、旅游、商業(yè)等一系列城市生活中的信息空間化,用于在空間信息支持下進行空間分析和決策應用[2]。

2 地理編碼設計與實現(xiàn)

地理編碼系統(tǒng)流程如圖 2 所示,主要包括地址標準化、地址匹配和地址量化三個關鍵步驟。為了實現(xiàn)這三個關鍵步驟,還需要相應的地址模型、地址詞典、地址數(shù)據(jù)庫以及相應的量化規(guī)則。

例如,要對“北京市海淀區(qū)復興路 11號”地址進行地理編碼,首先要進行地址切分、標準化,即轉化為 “北京”(市名)、“市” (市級單位)、“海淀”(區(qū)名)、“區(qū)”(區(qū)級單位)、“復興”(街道名)、“路”(街道單位)、 “11”(門牌號碼)、“號”(門牌后綴)等結構化的、標準化的詞組。然后,根據(jù)一定的地址匹配策略與GIS系統(tǒng)標準地址庫中的地址信息進行比對,獲得相匹配的地址記錄集,并通過插值等方式獲取一個對應的空間地理坐標值。最后,地理編碼量化就是對地理編碼過程的好壞程度進行數(shù)字化評價,將與“北京市海淀區(qū)復興路 11 號”相匹配的一組地址,按照匹配程度由高到低的呈現(xiàn)給用戶。

更多內容請查看pdf