解放地理信息

黃騫

論文來源:新經(jīng)濟(jì)導(dǎo)刊

摘要:海量數(shù)據(jù)問題一直是地理信息領(lǐng)域的 “阿基里斯之踵”

關(guān)鍵詞: 海量數(shù)據(jù)

大數(shù)據(jù)(Big Data)是將規(guī)模龐大、結(jié)構(gòu)復(fù)雜、動(dòng)態(tài)演變的數(shù)據(jù)進(jìn)行采集、篩選、管理、搜索、分析、挖掘與表達(dá)的技術(shù)統(tǒng)稱,是連通信息世界和知識(shí)世界的橋梁,也是數(shù)據(jù)科學(xué)(Data Science)的重要研究方向。

大數(shù)據(jù)的概念原本出自以谷歌為代表的新一代IT 公司,利用數(shù)據(jù)密集型復(fù)雜挖掘技術(shù)處理海量數(shù)據(jù),并創(chuàng)造驚人價(jià)值的現(xiàn)象,創(chuàng)立之初就頗有“沙里取金”的奪人眼球的效果。

美國政府年初宣布的“Big Data Initiative”,更是將其變成包括中國在內(nèi)的全球各國炙手可熱的新 “掘金點(diǎn)”,Map Reduce 迅速成為學(xué)術(shù)界、產(chǎn)業(yè)界反復(fù)炒作渲染的流行詞匯。

“大數(shù)據(jù)”技術(shù)來自搜索、電子商務(wù)、科學(xué)計(jì)算等領(lǐng)域長期與海量數(shù)據(jù)打交道所積累下的經(jīng)驗(yàn)積累,目前尚不存在公認(rèn)的基礎(chǔ)理論和解決方案。要真正理解大數(shù)據(jù),用好大數(shù)據(jù),必須跳出現(xiàn)有概念的窠臼,一方面從底層數(shù)據(jù)科學(xué)入手,提煉和解答出數(shù)據(jù)背后的科學(xué)問題,尋找數(shù)據(jù)真正的意義和基礎(chǔ)規(guī)律;另一方面需要遵循“從實(shí)踐中來,到實(shí)踐中去”的原則,在實(shí)際應(yīng)用中了解大數(shù)據(jù),研究不同領(lǐng)域的數(shù)據(jù)情況,明確大數(shù)據(jù)可以創(chuàng)造的核心價(jià)值與實(shí)現(xiàn)難點(diǎn)。

地理信息是天然大數(shù)據(jù)

從上世紀(jì) 60 年代誕生之日起,海量數(shù)據(jù)問題一直是地理信息領(lǐng)域的“阿基里斯之踵”。究其原因,主要是兩方面:

第一,地理科學(xué)面對(duì)的是一個(gè)復(fù)雜巨系統(tǒng)。 1986 年錢學(xué)森院士在現(xiàn)代人類知識(shí)體系將地理科學(xué)歸結(jié)為自然科學(xué)與社會(huì)科學(xué)之間的橋梁科學(xué),研究整個(gè)地球表面同人類息息相關(guān)的大氣對(duì)流層、巖石圈上部、水圈、生物圈和人類圈環(huán)境。因?yàn)樯现列l(wèi)星遙感數(shù)據(jù)、下至地震傳感數(shù)據(jù),以及我們常見的統(tǒng)計(jì)、環(huán)境、水利、資源、土地等領(lǐng)域數(shù)據(jù)都屬于地理數(shù)據(jù),所以地理信息技術(shù)需要處理的范圍廣,數(shù)據(jù)源多,數(shù)據(jù)類型多樣,其數(shù)據(jù)量巨大是不言而喻的。

第二,地球表面的信息量巨大,感知手段多樣。以谷歌地圖使用 Landsat TM 影像為例,其空間分辨率為 30 米,則單一時(shí)相全球完整覆蓋其整體數(shù)據(jù)量約為 2TB。2012 年底,我國已對(duì)成功發(fā)射天繪、天鏈、天拓、遙感、資源、氣象、海洋等多系列衛(wèi)星,建立起環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)小衛(wèi)星星座,“嫦娥一號(hào)”對(duì)月觀測(cè)也取得良好效果,而整個(gè)“十二五” 期間我國計(jì)劃發(fā)射百余顆衛(wèi)星。

更多內(nèi)容請(qǐng)查看pdf