圖書館書目資料模糊檢索系統

緣由與目的:

目前大部份圖書館的線上公用目錄(Online Public Access Catalog, OPAC) 系統主要是以布林邏輯(Boolean Logic)精確比對的模式提供書目查詢。 此種模式提供檢索條件之間的交集(AND)、聯集(OR)、差集(NOT)的運算, 甚至於後切截比對(truncation)以及檢索詞之間鄰近條件(proximity)的 過濾功能,對專業的檢索者而言,這些功能其實是相當有效的檢索工具。

然而由於一般的使用者對布林邏輯的運用較不熟悉、 檢索結果未能依照符合程度排序、以及檢索字串要求精確無誤等原因, 布林邏輯的比對模式易導致較高的檢索失敗率(search failure) 與資訊溢檢率(information overloading), 從而造成書目檢索系統不易使用的情形。

本研究以輔仁大學圖書館提供的書目資料, 逐步開發了「模糊搜尋」(即「近似字串比對」)、「相關詞提示」、 「相關詞回饋」、「相關程度排序」等功能,並整合在既有的 OPAC 系統上, 期使OPAC檢索系統除原有的跨欄位布林檢索外,亦能具有允許冗字、錯字、 資料誤植、資料記載不一致、中英文夾雜、自由詞彙、 以及近似自然語言檢索的功能。

成效:

  1. 新的檢索功能使用比例高,且此情形與受訪者對這些功能的熟悉程度無關, 但與受訪者無法精確表達查詢條件有關。
  2. 多數受訪者能遵循相關詞提示、繼而模糊搜尋、 之後繼續採用模糊搜尋或相關詞回饋的最有利過程進行資料查詢, 而且此現象也與受訪者對這些功能的熟悉度無關。
  3. 不論受訪者是否能夠精確表達查詢條件, 新的檢索功能沒有比傳統欄位式檢索系統提供更佳的檢索結果滿意度, 惟在找到資料的情形上表現較好。
  4. 多數受訪者(80%)對於系統自動擷取的詞彙, 偶有不合理的情形(10%)多可接受。
  5. 在理想的檢索環境下, 相關詞提示與相關詞回饋比用模糊搜尋直接查詢資料庫的成效更佳, 分別可提昇 38.2% 及 29.1% 的檢索成效。
  6. 從 1998 年建置至今,每個月平均都有 10000 次的查詢。 顯示使用者滿喜歡這種查詢方式。

系統特色:

  1. 模糊搜尋
  2. 相關詞提示
  3. 相關詞回饋
  4. 相關程度排序
  5. 檢索結果標示,以便顯示詳細資料、友善列印與郵寄

範例:系統展示

相關著作:

  1. 曾元顯, 林瑜一, " 模糊搜尋、相關詞提示與相關詞回饋在 OPAC 系統中的成效評估", 「中國圖書館學會會報 61 期」, 1998 年 12月, 第 61 期, 頁 103-125.

  2. 曾元顯, "架構在 WWW 與 Z39.50 上的近似自然語言 OPAC 檢索系統", 「大學圖書館」第 2 卷, 第 4 期, 1998 年 10 月, 頁 128-148.

  3. Yuen-Hsien Tseng, " Solving Vocabulary Problems with Interactive Query Expansion", Journal of Library Information Science, Vol.24, No.1, April, 1998, pp.1-18.

相關計畫:

  1. 曾元顯, 「架構在WWW與Z39.50上的近似自然語言公用目錄檢索系統」, 國科會87學年度研究計畫報告, NSC 87-2415-H-030-006-


Established on June 1, 1998, last modified on June 1, 2003 by
Yuen-Hsien Tseng <tseng@lins.fju.edu.tw>