狠狠躁天天躁夜夜躁婷婷,婷婷五月天色综合,大色小色网,日韩成人激情电影在线观看

專訪 | 李紹?。骸疤越稹笨臻g大數(shù)據(jù),GIS讓數(shù)據(jù)挖掘更高效

      對于大數(shù)據(jù)(Big Data),麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)、多樣的數(shù)據(jù)類型(Variety)和價值密度低(Veracity)四大特征。

 

      對于大數(shù)據(jù)(Big Data),麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)、多樣的數(shù)據(jù)類型(Variety)和價值密度低(Veracity)四大特征。

 

      在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》 中大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進行分析處理。大數(shù)據(jù)的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性)。

 

      無論是4V也好,5V也罷,大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不只是在于掌握龐大的數(shù)據(jù)信息,更多的是在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。

 

      聚焦到地理信息產(chǎn)業(yè),當前,基于位置的大數(shù)據(jù)應(yīng)用研究層出不窮。80%的大數(shù)據(jù)與位置相關(guān),在地理信息領(lǐng)域把這部分的數(shù)據(jù)應(yīng)用稱作是空間大數(shù)據(jù)應(yīng)用。

 

      空間大數(shù)據(jù)有何重要特點?GIS與空間大數(shù)據(jù)有什么關(guān)系?GIS如何融入空間大數(shù)據(jù)框架?將給人類的生產(chǎn)及生活帶來哪些改變?日前,我們專訪了超圖軟件副總裁、研究院院長李紹俊,圍繞多個話題對GIS與空間大數(shù)據(jù)進行了探討。

 

      空間大數(shù)據(jù)的4V特點

 

      “空間大數(shù)據(jù)與傳統(tǒng)GIS應(yīng)用有一定區(qū)別,用傳統(tǒng)的技術(shù)和軟件已經(jīng)很難將其支撐好?!崩罱B俊介紹,空間大數(shù)據(jù)一樣呈現(xiàn)出四大特征:體量大、變化快、種類多、價值密度低。其中,變化快和種類多是空間大數(shù)據(jù)與傳統(tǒng)GIS應(yīng)用區(qū)別比較明顯的兩點。

 

      GIS傳統(tǒng)應(yīng)用如地圖、導(dǎo)航等,偏靜態(tài)性,數(shù)據(jù)的更新呈現(xiàn)周期性特征,很多數(shù)據(jù)半年甚至更長時間更新一次。

 

      而大數(shù)據(jù)尤其是時空大數(shù)據(jù),則體現(xiàn)出明顯的實時、動態(tài)特征,如交通領(lǐng)域的車輛位置數(shù)據(jù)和實時路況數(shù)據(jù)、環(huán)保領(lǐng)域的PM2.5監(jiān)測數(shù)據(jù)、水質(zhì)監(jiān)測數(shù)據(jù)以及防汛抗旱領(lǐng)域的水位監(jiān)測數(shù)據(jù)等,都需要監(jiān)測裝置不間斷地實時采集并傳輸數(shù)據(jù),并標注在空間位置上,以監(jiān)控數(shù)據(jù)的實時動態(tài)變化。

 

      傳統(tǒng)模式下,GIS用到的數(shù)據(jù)無外乎矢量數(shù)據(jù)、影像數(shù)據(jù)等幾大類。矢量數(shù)據(jù)以點、線、面為主,如水利、交通領(lǐng)域的道路、河流、村莊、城市數(shù)據(jù),后來又逐步加入了遙感數(shù)據(jù)、衛(wèi)星影像數(shù)據(jù)等。

 

      現(xiàn)在,GIS管理的數(shù)據(jù)已經(jīng)遠遠超出上述范疇,增加了包括三維數(shù)據(jù)、傾斜攝影數(shù)據(jù)、點云數(shù)據(jù)、車輛位置數(shù)據(jù)各種物聯(lián)網(wǎng)數(shù)據(jù)等。GIS管理的數(shù)據(jù)種類也呈現(xiàn)出急劇膨脹的態(tài)勢。

 

“淘金”空間大數(shù)據(jù)


      要探討空間大數(shù)據(jù)的應(yīng)用與價值,可以從數(shù)據(jù)的信息化體系角度進行一些剖析。

 

      數(shù)據(jù)的信息化體系,業(yè)界一般也稱之為DIKW體系,是關(guān)于數(shù)據(jù)(Data)、信息(Information)、知識(Knowledge)及智慧(Wisdom)的體系,當中每一層比下一層賦予某些更深層次的特質(zhì)。

 

      第一個層面是數(shù)據(jù),是構(gòu)成信息和知識的原始材料。“數(shù)據(jù)的原始素材是二進制,是0和1的組合,難以直接辨識,需要經(jīng)過層層加工才能為我們所用?!?/p>

 

      數(shù)據(jù)提煉的第二層是信息。舉例來講,GIS數(shù)據(jù)存到計算機里都是二進制,但是它可以通過軟件可視化功能去展現(xiàn),把它們處理為地圖展現(xiàn)出來。經(jīng)過這一轉(zhuǎn)化,人們可以看見城市、道路、河流等圖形化信息。信息能夠被我們理解和判讀,邁出了數(shù)據(jù)價值挖掘的關(guān)鍵一步。

 

      第三個層面是知識,也即找出信息與信息之間的邏輯和關(guān)聯(lián), 并加入人類的經(jīng)驗和判斷。“舉例來講,給我們一張北京市房價分布圖,如果只是簡單的可視化,是信息的層面,但是找出房價高低空間分布與教育資源、醫(yī)療資源空間分布的關(guān)系,這就進入知識層面了?!?/p>

 

      DIKW體系的第四個層面是智慧層面,智慧強調(diào)對未來決策的輔助作用。比如說,知道北京的房價分布及分布原因,就可以針對不同的人群給予不同的購房建議。

 

      數(shù)據(jù)本身價值密度低,智慧來源于數(shù)據(jù)的積累,大數(shù)據(jù)是金礦,而不是黃金,要經(jīng)過挖掘和淘洗最后才能得到黃金。

 

      人類生活每天都要面臨很多決策。以前,人類決策更多依靠人生經(jīng)驗和判斷。而隨著大數(shù)據(jù)時代的到來,人類決策會參考相關(guān)數(shù)據(jù)。“行車參考導(dǎo)航實施路徑分析,購房也會參考周邊環(huán)境、資源、交通、教育、醫(yī)療等數(shù)據(jù)資源。這都是大數(shù)據(jù)給人類生活帶來的改變?!?/p>

 

空間大數(shù)據(jù)與GIS的關(guān)聯(lián)

 

      大數(shù)據(jù)與GIS關(guān)聯(lián)非常密切。

 

      首先,GIS本身就具有大數(shù)據(jù)的特征,其數(shù)據(jù)量非常大。例如早期的航天航空遙感數(shù)據(jù)、街景數(shù)據(jù),以及近年來的傾斜攝影原始數(shù)據(jù)等。

 

      其次,大數(shù)據(jù)有兩個非常重要的屬性:空間屬性和時間屬性,這兩點在GIS應(yīng)用中有著非常充分的體現(xiàn)。

 

      大數(shù)據(jù)種類多樣,給信息化帶來了很大的困難。傳統(tǒng)信息化里面非常核心的概念是數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫。而在大數(shù)據(jù)時代,很多數(shù)據(jù)難以簡單地實現(xiàn)結(jié)構(gòu)化,它們是非結(jié)構(gòu)數(shù)據(jù),如一些非測繪活動產(chǎn)生的與位置相關(guān)的大數(shù)據(jù),以及移動社交網(wǎng)絡(luò)數(shù)據(jù)、城市攝像頭數(shù)據(jù)、導(dǎo)航終端軌跡、可穿戴終端數(shù)據(jù)、手機信令數(shù)據(jù)等。

 

      以攝像頭數(shù)據(jù)為例,它很難結(jié)構(gòu)化地存到網(wǎng)格里,字段識別和查詢也很難。對于這些數(shù)據(jù)組織和管理其時間和空間屬性非常重要。這些用GIS來管理起來會有條理得多。

 

      再以電子商務(wù)為例,電子商務(wù)管理的數(shù)據(jù)量非常大,運用大數(shù)據(jù)做區(qū)域統(tǒng)計和挖掘分析,也需要GIS支撐。

 

      在政府信息化方面,政府在做教育資源布局、醫(yī)療資源布局等規(guī)劃時,更需要運用大數(shù)據(jù)和GIS的關(guān)聯(lián),做出智慧的分析。

 

      “前面列舉的例子,在大數(shù)據(jù)分析和利用等方面還處于初步階段,整體上還是以類似于關(guān)系數(shù)據(jù)庫的方式統(tǒng)計,基于這種統(tǒng)計能做的分析非常有限,很難與GIS深度結(jié)合?!崩罱B俊說,未來,把GIS能力融入到大數(shù)據(jù)體系是一個重要的發(fā)展方向?!癎IS經(jīng)過這么多年的發(fā)展,已經(jīng)基于空間的分析、挖掘、統(tǒng)計、計算形成非常完整而科學的一整套體系。把這兩個體系融合,將有效促進大數(shù)據(jù)的價值提煉?!?/p>

 

 空間大數(shù)據(jù)與GIS結(jié)合:超圖優(yōu)勢明顯


      “在業(yè)界,超圖在與大數(shù)據(jù)的結(jié)合和應(yīng)用具有一些典型優(yōu)勢”。李紹俊介紹說,大數(shù)據(jù)是一整套框架系統(tǒng),涉及到幾十種軟件,這些軟件大多在Linux開源社區(qū)最先發(fā)展起來。大數(shù)據(jù)當前最理想的、運行效果較好的運行環(huán)境也是Linux相關(guān)領(lǐng)域,這就要求GIS要能夠原生支持Linux系統(tǒng),這也是大數(shù)據(jù)和GIS結(jié)合的重要基礎(chǔ)條件。在這方面,超圖具有業(yè)界首屈一指的跨平臺基礎(chǔ),具備天然優(yōu)勢?;跇藴蔆++的核心內(nèi)核,SuperMap GIS可以原生高性能地運行在Linux環(huán)境里,也可以更好更快地支持大數(shù)據(jù)運行環(huán)境。

 

      “與Windows內(nèi)核GIS平臺相比,超圖這方面的優(yōu)勢非常明顯。如果說內(nèi)核是基于Windows系統(tǒng),需要在Spark里面重新包裝或者重新開發(fā)GIS能力,超圖則避免了這方面的重復(fù)開發(fā)。”李紹俊介紹。

 

      “現(xiàn)在大數(shù)據(jù)最熱的框架是Spark。SuperMap C++跨平臺內(nèi)核與Spark可以良好結(jié)合,GIS軟件直接嵌入Spark 內(nèi)核級運行,在此基礎(chǔ)上誕生了SuperMap iObjects for Spark,讓空間大數(shù)據(jù)挖掘更簡單,可實現(xiàn)空間大數(shù)據(jù)可視化,分布式存儲、檢索、管理,以及高性能處理、挖掘與分析。”李紹俊說這方面目前已有一些初步的應(yīng)用。

 

      目前,超圖在數(shù)據(jù)存儲、數(shù)據(jù)可視化、數(shù)據(jù)查詢分析與統(tǒng)計方面都可以與Spark有很好的結(jié)合,已發(fā)布一些與Spark結(jié)合的模塊和GIS產(chǎn)品。這些模塊和產(chǎn)品可以讓用戶能夠更方便地將GIS處理與分析能力應(yīng)用到大數(shù)據(jù)環(huán)境。

 

      未來幾年,大數(shù)據(jù)將是超圖從軟件研發(fā)到行業(yè)應(yīng)用的核心聚焦點。“超圖致力于提供的不是大數(shù)據(jù)本身,而是大數(shù)據(jù)的處理能力與處理平臺,讓更多人擁有處理空間大數(shù)據(jù)能力?!崩罱B俊表示。