1 中國科學院地理科學與資源研究所,北京,100101
2 環(huán)境保護部衛(wèi)星環(huán)境應用中心,北京,100094
3 北京超圖軟件股份有限公司,北京,100015
論文來源:《武漢大學學報 · 信息科學版》第42卷 第2期2017年2月
摘要:基于關系型數(shù)據(jù)庫的空間數(shù)據(jù)存儲與處理是地理信息系統(tǒng)(geographic information system,GIS)領域的主流模式,但伴隨著物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算及空間數(shù)據(jù)采集技術的發(fā)展,空間數(shù)據(jù)已從海量特征轉變?yōu)榇髷?shù)據(jù)特征,對空間數(shù)據(jù)的存儲和管理在數(shù)據(jù)量和處理模式上提出了新的挑戰(zhàn)...
關鍵詞: 空間數(shù)據(jù)庫,大數(shù)據(jù),NoSQL數(shù)據(jù)庫,分布式存儲
新技術的發(fā)展給空間數(shù)據(jù)存儲與管理又提出了新的挑戰(zhàn)。物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和云計算技術及應用的蓬勃發(fā)展,使得空間數(shù)據(jù)在數(shù)據(jù)量和應用模式上發(fā)生了轉變;此外,傳感器技術的發(fā)展,使采集數(shù)據(jù)的空間分辨率和時間分辨率顯著提高,導致所獲取的數(shù)據(jù)規(guī)模成指數(shù)級快速上升,面對動輒以 TB(trillionbyte ),甚至PB(petabyte)計的數(shù)據(jù),也給空間數(shù)據(jù)存儲和處理帶來巨大的壓力。
傳統(tǒng)的基于關系型數(shù)據(jù)庫的空間數(shù)據(jù)存儲與管理已經(jīng)無法滿足大數(shù)據(jù)存儲和處理的實際應用要求,隨著互聯(lián)網(wǎng)領域云技術、非關系型數(shù)據(jù)庫技術的迅速發(fā)展,各種分布式 GIS技術的研究成為研究熱點。本文主要著眼于空間大數(shù)據(jù)的存儲與管理,首先分析了傳統(tǒng)集中存儲模式在大數(shù)據(jù)存儲方面的局限性;然后,針對互聯(lián)網(wǎng)領域大數(shù)據(jù)的成功解決方案,研究當前主流 NoSQL數(shù)據(jù)庫的特點,分析其在處理空間數(shù)據(jù)時的優(yōu)勢與不足;最后,針對這些需求和存在的問題,本文提出空間大數(shù)據(jù)分布式存儲與處理策略,并在原型系統(tǒng)中進行試驗驗證。
基于成熟的關系型數(shù)據(jù)庫設計空間數(shù)據(jù)引擎,集中存儲和管理空間數(shù)據(jù)是當前應用的主流模式。
從空間數(shù)據(jù)引擎和關系數(shù)據(jù)庫與應用程序結合的緊密程度來看,可以將空間數(shù)據(jù)引擎的體系結構分為內(nèi)置模式、三層結構模式和兩層結構模式,這些集中存儲模式很好地解決了海量空間數(shù)據(jù)存儲和管理的問題。
目前,各種地理空間信息獲取手段多樣、數(shù)據(jù)規(guī)模巨大、更新頻率快、數(shù)據(jù)應用現(xiàn)勢性強。傳統(tǒng)的空間數(shù)據(jù)集中,單一的存儲方式不能滿足大數(shù)據(jù)高并發(fā)甚至高時效的應用要求,空間數(shù)據(jù)從海量特征轉變?yōu)榇髷?shù)據(jù)特征對存儲技術的要求主要表現(xiàn)如下
在互聯(lián)網(wǎng)領域,基于非關系型數(shù)據(jù)庫的NoSQL數(shù)據(jù)庫技術已經(jīng)得到成功應用。從數(shù)據(jù)存儲的角度來說,NoSQL數(shù)據(jù)庫非常適合空間大數(shù)據(jù)的存儲,但互聯(lián)網(wǎng)領域的應用模式與 GIS領域存在一定差異,由此產(chǎn)生的局限性主要包括如下方面
本文綜合 NoSQL數(shù)據(jù)庫和關系型數(shù)據(jù)庫各自的優(yōu)勢,提出一種混合的空間大數(shù)據(jù)分布式存儲策略,既滿足大數(shù)據(jù)存儲的需要,又能滿足傳統(tǒng)GIS應用的需求。
更多內(nèi)容請點擊下方的PDF下載