Michael Gorman 對 Google print library project 的反對意見

雖然 Google 前一陣子宣稱暫緩圖書館計劃的掃描工作,但是對於沒有版權爭議部分的書籍掃描工作還是持續在進行著。稍稍回顧一下一些之前的討論。

原文: One College Librarian Worries About ‘Atomizing’ Books

ALA 主席 Michael Gorman 批評 Google
他認為學術研究對如Google之類的搜尋引擎的利用越來越普及,會對學術研究造成不好的傷害。因為:

  1. 搜尋引擎就算加入許多圖書館的內容(指Google print library project),也不會在內容上超越傳統的圖書館;Google只能摘錄少部分受智財權保護的著作,因此較不具價值;
  2. Gorman 認為 Google 並不是在「數位化」書本,他們是把書本「原子化(they’re atomizing them)」,把書本打散為段落與句子(Gorman客氣了,全文檢索是把資料拆解成一個個字了),而把內容從可以理解的情境中抽離出來;這對於研究來說會造成不好的影響。

想法

對於濫用資訊檢索工具,而對研究品質產生不良的影響。這點我也認同,而且還看過不少例子。我還跟瑋泓半開玩笑討論過要研究他們哲學研究生使用佛學數位資料庫來拼貼論文的資訊行為研究。我認為Gorman提出的問題很重要,但是這不是Google或是任何搜尋引擎或資料庫服務的問題,任何資訊工具產生的便利性都會對學術行為帶來些影響。這中間有更深刻的問題需要探討,而非歸咎於任何資訊服務。

對於「原子化(they’re atomizing them)」的批評,我想引用Shera, J. H. (1976)的說法:
「就像忠誠的 Isis,圖書館員必須含悲搜尋破碎成一千片的真理,他是被人類經驗所割碎的。優秀圖書館員的動機,並非通常所說的愛好圖書,而是愛好真理—無論它在何處以何種方式出現。知識的終極乃是智慧,智慧乃是全面理解真理的力量—圖書館員專業精神即基於此。它以多種不同的形式和方法,為各色各樣的廣大讀者服務。」(p. 41)
「書是實體的物件,… 不過我們所關心的並非圖書的物質形式;它可以有許多形狀和各種大小。圖文記載可以是錄音帶、唱片、影片,而仍不失為圖文記載,它是創造者所賦予的物質型態。我們在此所注意的指向,是書之為智性(intellectual)產物,這才是圖書館員主要關注的事。」 (p. 54)

Shera認為圖書館提供的是知識與真理,並不是書本。而這些知識與真理散落在不同的形體之中。檢索技術的運用無可厚非的需要分析資料的一個個片段,這必須回歸到進行資訊檢索或是資訊組織的目的,都是為了讓使用者能利用資訊而獲得知識。單就技術上批評將書本數位化掃描工作會破壞書籍的完整性,未免太過刻薄;更何況也不會有任何書能代表著完整的知識。

stereotype

Gorman 其實也呈現了一些圖書館員的看法:

  • A much more efficient way to find books on topics is to use any of the huge union catalogs that exist.
  • Libraries are user-friendly, and we have changed.

平心而論,必須同意 Gorman 的看法。傳統圖書館提供的資訊服務功能在資訊時代,往往被過度低估了。

bloggers’ discussions

  • Gorman: “That does not mean that everything can be dumbed down to some kind of hip-hop or bells-and-whistles kind of stuff.”

Gorman 這句話到是後來引起一些圖書館bloggers的抗議,掀起一陣意外的風波:


密西根觀點

這篇文章的後半部,是由 John P. Wilkin,密西根大學圖書館的助理館員的訪談。密西根大學圖書館是最早跟Google合作的大學圖書館。

  • Wilkin認為圖書館不擔心資訊都被數位化而失去價值,圖書館除了收藏資訊,同時也是一個連結使用者與資訊的場所。他認為現在大家越來越認同圖書館是一個「場所」的概念。儘管資訊取得的管道越來越方便,但是人們卻更願意來這裡與其他人一起使用資訊;密西根大學增加數位資源與服務的同時,實際上來訪圖書館的人次也隨之增加。

Google print library project 基本資料

五所圖書館與Google合作,Google將掃描圖書館中的書籍。

  • 哈佛大學 (Harvard U.)在計劃的初期將提供 40,000 本版權已屬於公共領域的(public-domain)的書籍。之後可能在追加。哈佛大學圖書館總共有一千五百萬冊以上的書籍。
  • 史丹佛大學 (Stanford U.) 提供成千上百的公共領域書籍,但是最終可能將所有七百六十多萬冊的書籍都進行掃描。
  • 密西根大學安娜堡校區 (U. of Michigan at Ann Arbor) 所有館藏的七百八十萬本書籍都會參與這項計劃。其中有些仍然在版權保護期限之內。
  • 英國牛津大學 (U. of Oxford (England)) 將提供所有1900年以前出版的書籍。英國牛津大學總共有六百五十萬本的館藏。
  • 紐約公共圖書館 (New York Public Library) 計劃先期將提供數萬本屬於公共領域版權的書籍。圖書館內總共館藏有兩千萬冊。