2構建石油地質領域本體
手工構建本體是一項耗時耗力的巨大工程,自動化構建本體技術尚不成熟[1,4],鑒于已有完善的《地質敘詞表》和《石油主題詞表》,因而本文提出一種基于敘詞表的半自動化本體構建方法,具體方法如圖2所示。地質敘詞表又稱為地質主題詞表,包含了地質學科的詞匯和詞匯之間的各種關系。敘詞表的語義關系分為“用、代、分、屬、參”,分別用來表示詞匯之間的等同、等級、相關等語義關系。敘詞表包含較全面和權威的領域概念和重要的語義關系,為本體提供了較好的概念基礎。很多研究嘗試基于敘詞表進行構建本體,研究重點在于敘詞表向本體轉換的方法。由敘詞表構建本體的方法將敘詞表的敘詞作為本體中概念的來源,在敘詞表概念關系的基礎上,修改完善概念的屬性、關系,并添加公理和函數。敘詞表的相關關系沒有更細的劃分,包含了本體一般定義中除了層次關系和等同關系外的所有關系。所以要想建立更精確的領域本體,除了敘詞的注釋,還需要參考其他知識來源,如《石油地質》、《中國石油勘探開發百科全書》等,為本體的類添加需要的關系[4]。最終通過概念和概念層級的確定、定義概念的屬性、對漢語拼音、敘詞編號、英文譯名、范疇號、注釋項的處理及為概念添加實例等工作[5],構建了輕量級的石油地質領域本體,完成的面向知識服務的石油地質領域本體包含18278個概念,概念之間的關系達到16487個,概念的實例4137個。關系分為等同關系、等級關系和相關關系,其中相關關系除包含敘詞表中固有的相關關系,還增加了相關領域學科,如信息技術及數學地質。實例涵蓋了石油人物、書籍、機構以及重點區域等,具體如圖3所示。
3石油地質語義檢索原型系統設計與實現
3.1系統原型設計與實現
發表評論 |