文獻信息檢索系統的核心是數據庫,而數據庫本身又常以收錄内容及功能的不同劃分為如下幾種類型。
1.書目型數據庫(bibliographic database)主要是指二次文獻數據庫,包括各種機讀版的題錄型、文摘型的數據庫。如《中國生物醫學文獻數據庫》(SinoMed)、MEDLINE等。它們提供了可滿足用戶多種信息檢索需求的有關文獻的各種特征,如文獻的篇名、著者、出處(包括刊名、年、卷、期、頁碼)、摘要、收藏單位等。不僅可以告知用戶其所需文獻的線索一題錄 (包括篇名、著者、出處),更可以提供整篇文獻内容濃縮的替代品一文摘。 因此,這是文獻檢索中最常用的一種數據庫。
2.事實數值型數據庫( fact-date database)主要為用戶提供有關事物、人物、機構等方面的事實性信息和數值型數據。例如萬方數據資源系統中的事實型數據庫《中國科研機構數據庫》《中國科技信息機構數據庫》《中國高等院校及中等專業學校數據庫》,美國國立癌症研究所的關于癌症治療信息的醫生咨詢數據庫(PDQ),反映藥物處方信息的《醫師案頭參考書》(Physicians'Desk Reference, PDR)等。電子化的參考工具書,如詞典、百科全書指南等也屬于事實型數據庫的範疇。
3.全文型數據庫 (full-text database)是将文獻全文的全部内容轉化為計算機可以識别、處理的信息單元而形成的數據集合。全文型數據庫對文獻的字、詞、句,乃至段落等進行更深層次的編輯加工,允許用戶采用自然詞語以及截詞、鄰近算符等匹配方法,方便快速地查到所需的文獻,并能直接獲取文獻原文。例如CNKI的學術文獻總庫、萬方數據資源系統中的數字化期刊、EIsevier Science電子期刊全文庫。因此,全文型數據庫是集文獻線索的查詢和文獻全文的提供于一體,實現了畢其功于一役的一站式信息服務。
4.知識型數據庫(knowledge database)一種疾病, 不僅有一個概念性的界定,而且涉及病因、病理、診斷、治療等相關知識;一種藥物,不僅有其化學結構上的名稱或命名,而且有藥理作用、藥效動力、副作用、适應證、使用方法等相關知識; -項檢查,不僅有其概要性描述,而且涉及原理、檢測值的解釋、臨床意義、操作方法、正常值範圍、适用範圍等一系列相關知識。以這些疾病、症狀、藥物、檢查項目等概念為知識點或檢索點,将這些概念的知識解析内容,以概念的相關語義關系為紐帶編制成一個具有知識結構特征和層級範圍的立體網狀的知識庫。與以往的文獻信息系統不同,檢索到的不是文獻,而是對概念的知識解讀。例如中國疾病知識總庫(China Disease Knowledge Total Database)所包括的疾病數據庫、藥品數據庫、輔助檢查數據庫等多種知識庫。
,