目前的信息服務主要是依靠檢索詞匹配的方式來實現資源的查詢與利用,因而檢索詞匹配的程度直接決定了資源的利用率和信息服務的效果。依靠檢索詞匹配方式的檢索系統主要存在的問題是,由于忽略了知識資源的語義層面,因而造成了大量語義知識資源的確缺失,無法準確地反映知識資源與用戶檢索需求之間的相似度[1]。特別是面對海量、異構的地質資料數據,傳統的信息服務系統很難滿足用戶的檢索需求。具有語義匹配功能和本體知識技術的知識服務系統成為當前研究熱點和難點。
1地質服務的知識框架
隨著信息服務系統的不斷發展,地質資料已從傳統的借閱服務轉變為知識服務,即按照知識結構和語義特征進行資料的組織、共享與服務已經成為必然趨勢。本體能夠構建出清晰的領域知識框架及脈絡,繼承已有的知識資源,避免重復工作,使得知識資源的高效快捷的重用及共享成為可能。在本體的基礎上將行業內的標準規范、統計數據、學科知識脈絡、研究進展和資源索引庫等資源進行多元融合,就可以形成較為豐富完善的領域產品,以產品層作為數據支撐,就可以構建出個性化的領域知識服務系統。結合石油領域特點,本文提出了基于本體的石油地質領域知識服務框架,具體如圖1所示。資源層:石油地質領域的原始資源來自于書籍、研究報告、各類原始數據和統計數據、地質圖庫、油藏模型以及網頁上的資源等各種形式的已有工作成果。知識層:要實現地質領域的知識服務,首先要建立領域知識架構。地質本體能夠提供包括石油地質領域、構造地質領域、古生物領域等各類地質領域知識的結構化描述、定義及屬性[2]。產品層:知識服務需要有豐富多樣的產品作為支撐,包括基于本體的學科知識脈絡、數據產品、統計數據產品、研究進展報告及資源索引庫等。這些知識產品一方面提高用戶檢索資源的命中率,找到用戶真正需要的資源;,另一方面還能夠為用戶提供可能與檢索需求相關的參考概念,以及相應的資源。服務層:學科知識服務的主要途徑是用戶主動檢索。這種檢索可以在機構內網,也可以通過互聯網。知識檢索的對象可以是結構化的領域本體,可以是基于知識網絡索引的一般資源,服務層的目標就是為各種類型用戶滿足各種不同的需求,最終提供個性化服務。知識服務的根本目的就是能夠直截了當的為用戶提供真正需要的知識和資源,省去用戶自己歸納總結篩選排除的過程。本文所提出的基于本體的地質領域知識服務框架,能夠把松散地存放于各處的原始資料進行加工處理,形成系統的知識結構,將構建成的領域本體進一步開發形成知識產品,最后實現知識服務。結合石油地質領域的特點,本文構建了石油地質領域本體,并基于開源的全文搜索工具包Lucene等技術實現了石油地質領域知識檢索系統試驗[3]。
發表評論 |