( 1中國科學院地理科學與資源研究所, 北京 100101; 2中國科學院研究生院, 北京 100049)
論文來源:測繪科學
摘要:本文通過對近年來遙感影像理解 ( IU: Im age U nde rstanding) 研究的分析, 本文給出了遙感影像理解的框架流程, 討論了高級語義特征和低級影像特征, 針對流程中的各個任務介紹了有代表性的方法應用, 并對發(fā)展趨勢進行預測, 特別是基于知識系統(tǒng)和影像認知的應用。
關鍵詞: 影像理解; 模式識別; 特征提取; 綜述
1 引言
大量的航空和航天傳感器設備為我們獲得了巨大的對地觀察數(shù)據源, 使得對地球表層細節(jié)分析、變化監(jiān)測和管理等應用成為可能 [ 1] 。特別是高分辨率的衛(wèi)星遙感影像 (如IKONOS, SPOT 5, COSMOS, O rbV iew 等 ) 的發(fā)展使得遙感影像的深入應用成為可能, 從而為 G IS數(shù)據的更新、G IS的應用提供了有利的條件; 對于生態(tài)研究、土地管理、災害監(jiān)測等也具有重要意義 [2] 。快速準確地從影像中提取影像信息, 實現(xiàn)影像理解是目前遙感應用, 特別是影像更高層次應用的瓶頸。
目前影像理解在一定領域有較成功的應用, 如軍事目標提取, 醫(yī)學影像解譯, 道路提取, 建筑物提取等, 但對于地表的遙感影像理解仍懸而未解, 是目前非常活躍的研究領域 [ 2, 3] 。
本文從廣義的影像理解出發(fā), 對高分影像分析和理解的基本思想和方法進行了探討, 討論了用于影像理解的高級語義特征和低級影像特征, 對近年來有代表性的影像理解方法: 基于知識 ( Know ledge-based ) 的方 法、神 經網絡( NN: N eu ra l N etwo rk) 方法和 貝葉斯網 絡 ( BN: Bays N et-w ork) 方法, 及相關算法: 遺傳算法 ( G enetic A lgo rithm )、模糊理論 ( Fuzzy T heo ry) 、支持向量機 ( SVM: Suppo rt V ecto r M achines)、集成算法等進行了分析和總結, 并對影像理解的進一步發(fā)展做出展望。考慮到文章的篇幅, 沒有做過多展開, 詳細信息請參考引文。
2 遙感影像理解 ( R emote Sensing Image Under-stand ing)
2.1 影像理解概念
影像理解 ( im ag e understand ing) 最初是指通過利用計算機對影像進行基于知識解譯工作, 始于 1975年。而后成為信號處理、統(tǒng)計分析、模式識別、人工智能、心理學和神經學等多學科交叉的研究領域。計算機視覺也與影像理解同指相關領域研究, 但前者偏向于視覺信息的處理計算方面, 如三維形狀信息的測量; 而后者強調影像解譯過程中知識的表達和推理。L uo等參考相關文獻給出繼承性的影像理解概念, 即把計算機影像表達轉換為知識的符號表達,也可以說是 / p ixe ls to perd icates0, 同時指出影像理解是計算機視覺的最高抽象層次; 而影像處理只是換了一種影像表達方式, 如從柵格像元變?yōu)橛袇^(qū)域邊界的地圖[ 4]。同時,許多學者引入認知心理學的術語 ) ) ) 語義 ( Sem antic)、圖解( Schem a) 等, 把 語 義 影 像 理 解 作為 影 像 理 解 的 最 高層次 [ 1, 5] 。
2.2 影像理解架構
事實上, 大多數(shù) IU 系統(tǒng)都需要專業(yè)背景知識的參與,但由于影像和知識的復雜性, 使得整個系統(tǒng)需要考慮的因素很多, 決定了 IU 系統(tǒng)的復雜性。為了解決這個問題, 很多學者對 IU 進行了任務化 (模塊化 ) 的抽象, 對流程進行分析設計。
Jurie等給出了基于知識動態(tài)的影像理解系統(tǒng)的定義和框架。 Bahr考慮知識在影像理解中的應用, 給出了影像理解流程。 Fan等提出多級架構 ( M ulti-L eve l)即原始遙感影像( O rig inal Image)、語義敏感影像表達 ( Salient Ob jects)、語義影像 ( Semantic Im ag e)三級來實現(xiàn)遙感影像理解, 并成功應用于花園, 山脈、航行、海灘等場景的識別[ 6] 。L uo綜述了影像理解的通用架構, 基于貝葉斯網絡提出影像理解的流程, 強調低級特征 ( 如顏色、紋理、形狀等 ) 與語義特征的結合作為貝葉斯網絡的輸入, 最終達到對影像的語義理解的目的 [ 4] 。T adeusiew icz等在研究了模式識別與影像理解關系的基礎上, 提出影像理解的一般范式, 即數(shù)據流 (前饋模式 ) 與影像解譯的語義流的認知共鳴 ( cognitive reso-nance)來實現(xiàn)影像的理解 [ 7] 。T orra lba等強調全景環(huán)境特征對于對象識別的重要作用, 此外還有 L iedtke, H e等對此進行了研究。
基于以 上研究, 給出 以影像數(shù)據和知識為主要輸入的影像理解流程 ( 忽 略成 熟的 預 處 理 階段 ), 如 圖 1所示。在此 流程中, 將影像理解任務模塊化, 有利于不同模塊應用不同方法及不同應用系統(tǒng)中模塊的重用。
更多內容請查看pdf