(1. 中國(guó)科學(xué)院地理科學(xué)與資源研究所,北京 100101;2. 中國(guó)科學(xué)院研究生院,北京 100039; 3. 北京超圖地理信息技術(shù)有限公司,北京 100085)
論文來(lái)源:計(jì)算機(jī)工程
摘要:針對(duì)大部分的地理位置信息都采用文本方式進(jìn)行描述而非地理坐標(biāo),提出適合中國(guó)地址描述實(shí)際情況的地理編碼關(guān)鍵技術(shù)和實(shí)現(xiàn)方法,主要包括地址標(biāo)準(zhǔn)化、地址匹配、地理編碼量化等,并在地理信息系統(tǒng)軟件中實(shí)現(xiàn)了中文和英文地理編碼功能,實(shí)驗(yàn)證明該方法具有較小的地理編碼誤差率?!?/span>
關(guān)鍵詞: 地理編碼;地理信息系統(tǒng);地址模型;地址標(biāo)準(zhǔn)化;量化
1 地理編碼概述
地理編碼也稱(chēng)地址匹配,是指將地址映射成地理坐標(biāo)的過(guò)程,提供了一種把描述成文本地址的地理位置信息轉(zhuǎn)換成地理坐標(biāo)的方式[1]。計(jì)算機(jī)無(wú)法通過(guò)文字?jǐn)⑹鲋苯诱业侥繕?biāo)位置,無(wú)法直接獲取其具體的經(jīng)緯度坐標(biāo)。例如,用“北京市海淀區(qū)復(fù)興路 11 號(hào) ”來(lái)表示中國(guó)中央電視臺(tái)的位置,計(jì)算機(jī)無(wú)法僅從“北京市海淀區(qū)復(fù)興路 11 號(hào)”獲得中央電視臺(tái)的具體坐標(biāo)位置。地理編碼可以利用地址數(shù)據(jù)庫(kù)來(lái)建立地址與地理坐標(biāo)空間的對(duì)應(yīng)關(guān)系[2]。地理編碼是各種算法程序的集合,主要采用結(jié)構(gòu)化的數(shù)據(jù)模型,將各種興趣事件或者現(xiàn)象的文本地址與地址數(shù)據(jù)庫(kù)進(jìn)行匹配[3]。
隨著 GIS 在人們生產(chǎn)生活中的作用越來(lái)越重要,對(duì)于根據(jù)文本地址快速、準(zhǔn)確地查找其地理坐標(biāo)的需求日益明顯。在互聯(lián)網(wǎng)服務(wù)領(lǐng)域,基于位置的服務(wù)被越來(lái)越多地應(yīng)用,采用地理編碼技術(shù),地圖搜索引擎和地圖服務(wù)網(wǎng)站的準(zhǔn)確度和響應(yīng)速度將得到提高(圖 1)。
在公共服務(wù)領(lǐng)域,緊急情況下獲得的地址往往是不完整的、甚至是不準(zhǔn)確的,而需要計(jì)算機(jī)系統(tǒng)快速、準(zhǔn)確定位;SARS 期間,有關(guān)單位每天上報(bào)的新增病例信息中,也包括描述性住址,若要進(jìn)行流行病學(xué)分析,就需要獲取其坐標(biāo)位置[0]。通過(guò)地理編碼,可以實(shí)現(xiàn)原有信息系統(tǒng)和空間信息的融合,將日常的經(jīng)濟(jì)、社會(huì)、人文、歷史、旅游、商業(yè)等一系列城市生活中的信息空間化,用于在空間信息支持下進(jìn)行空間分析和決策應(yīng)用[2]。
2 地理編碼設(shè)計(jì)與實(shí)現(xiàn)
地理編碼系統(tǒng)流程如圖 2 所示,主要包括地址標(biāo)準(zhǔn)化、地址匹配和地址量化 3 個(gè)關(guān)鍵步驟。為了實(shí)現(xiàn)這 3 個(gè)關(guān)鍵步驟,還需要相應(yīng)的地址模型、地址詞典、地址數(shù)據(jù)庫(kù)以及相應(yīng)的量化規(guī)則。
例如,要對(duì)“北京市海淀區(qū)復(fù)興路 11 號(hào)”地址進(jìn)行地理編碼,首先要進(jìn)行地址切分、標(biāo)準(zhǔn)化,即轉(zhuǎn)化為 “北京”(市名)、“市”(市級(jí)單位)、“海淀”(區(qū)名)、“區(qū)”(區(qū)級(jí)單位)、 “復(fù)興”(街道名)、“路”(街道單位)、“11”(門(mén)牌號(hào)碼)、
更多內(nèi)容請(qǐng)查看pdf