第三節計算機信息檢索
隨著計算機技術的出現與發展,傳統的靠“手翻、眼看、大腦判斷”的檢索方式已難以全面適應信息量增長的需要,計算機信息檢索應運而生并普及開來。
一、計算機信息檢索的特點、類型與方法
計算機信息檢索已成為檢索文獻信息的重要手段,與傳統的手工檢索相比,它表現出明顯不同的特點。
(一)計算機信息檢索的概念與特點
計算機信息檢索是指用計算機或其他終端,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統的數據庫中檢索所需要的信息資料的過程。這些信息資料可在計算機上閱讀,也可下載、存儲到各種存儲設備中,或打印在紙上,有的還可以通過電子郵件發送。
計算機檢索不僅能夠跨越時空,在短時問內查閱大型數據庫,快速地對以前的文獻資料進行檢索,而且大多數聯機或網絡檢索系統數據庫中的數據更新速度非常快,用戶通過計算機信息檢索可以隨時得到更新的信息。計算機檢索已成為檢索文獻信息的重要手段。因此,與手工檢索一樣,計算機信息檢索應成為出版專業技術人員的一項基本功。這一能力的訓練和培
養對出版專業技術人員適應信息社會的發展極其重要。一個善于從電子信息系統中獲取信息的專業技術人員,必定擁有更多的成功機會。
(二)計算機信息檢索的類型
根據產生時間先后及檢索設備特征、檢索方法的不同,計算機信息檢索一般分為聯機檢索、光盤檢索和網絡信息檢索。
使用聯機檢索系統可利用國內外大量規范化的專業數據庫進行科技信息、經濟信息及商業信息的檢索,迅速地檢索到相關的信息。聯機檢索分辨率高,有較高的查全率和查準率,但聯機檢索需要專門設備,費用較高,需要較熟練地掌握檢索技術。聯機檢索面向檢索專家或中介機構,需要專業的檢索人員,在出版單位的日常工作中使用很少。光盤檢索具有信息更新不及時等缺點,而且隨著計算機信息網絡的發展,Dialog等著名的國際聯機檢索系統和《中國學術期刊》等原先的光盤版數據庫,也紛紛推出了基于網絡的信息檢索系統。因此,本章
主要介紹網絡信息檢索。
(三)計算機信息檢索的基本方法
計算機信息檢索主要有如下幾種方法。
1.布爾邏輯檢索
布爾邏輯檢索是一種比較成熟、較為流行的檢索技術,現代的信息檢索多采用這種技術。
布爾邏輯檢索的基礎是邏輯運算,邏輯運算中最常用的是布爾邏輯運算符(BooleanLogicOperator),主要的運算符有以下幾種。
(1)邏輯“與”
邏輯“與”用and(或*)表示。檢索詞A、B若用邏輯“與”相連,即AandB(或A*B),則表示同時含有這兩個檢索詞的文獻才能被命中。例如,要檢索“兒童教育”的文獻,檢索邏輯可表示為:兒童and教育。
(2)邏輯“或”
邏輯“或”用or(或+)表示。檢索詞A、B若用邏輯“或”相連,即AorB(或A+B),則表示只要含有其中一個檢索詞或同時含有這兩個檢索詞的文獻都可以被命中。例如,要檢索“數字出版”和“電子出版”方面的文獻,檢索邏輯可表示為:數字出版0r電子出版。
(3)邏輯“非”
邏輯“非”用not(或andnot,或butnot,或)表示。檢索詞A、B若用邏輯“非”相連,即AnotB(或A—B),則表示被檢索文獻在含有檢索詞A而不含有檢索詞B時能被命中。例如,要檢索有關“能源”方面的英文文獻,但涉及“核能”方面的文章不要,邏輯表達式可表示為:enengynotnuclear(或energy-nuclear)。
not可以縮小檢索范圍,但須謹慎從事,只有當確信要從檢索結果中排除一個術語或短語時才用。
布爾邏輯運算的次序為:邏輯“非”一邏輯“與”邏輯“或”,若有括號,則括號優先,這同算術中的四則運算相似。
2.短語檢索
短語用雙引號(“”)括起表示,可檢索出與引號內形式完全相同的短語。例如,要檢索期刊《出版發行研究》,輸入置于引號內的“出版發行研究”,就只會檢索到這六個字緊挨在一起的記錄;如果不加雙引號,有的搜索引擎會把出版、發行、研究這三個詞作布爾邏輯“與”的運算,它們之間可能相隔很遠,順序也可能改變。
3.截詞檢索
截詞檢索是在檢索標志中保留相同的部分,用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相同部分標志的記錄全部檢索出來。截詞檢索主要用于英文檢索。對于詞干相同而詞尾不同的詞(如publish,publisher,publishers,publishing)和一些不同拼法的詞(如defence,defense),如果檢索時將這類詞全部輸進去,會增加檢索時間和費用,采用截詞法可解決這一問題。
截詞符多用“?”或“*”表示,如:輸入publish*,會檢索出publish,publisher,publishers和publishing等所有以Dublish這七個字母開頭的單詞,不管它后面還有多少個字母。
(責任編輯:gnn)
近期直播
免費章節課
課程推薦
出版資格
[VIP通關班-協議退費]
7大課程模塊 2大研發資料 準題庫高端服務
出版資格
[VIP通關班-暢學]
6大課程模塊 2大研發資料 準題庫高端服務
出版資格
[零基礎通關班]
3大課程模塊 準題庫高端資料 校方服務