Michael Gorman 對 Google print library project 的反對意見

雖然 Google 前一陣子宣稱暫緩圖書館計劃的掃描工作,但是對於沒有版權爭議部分的書籍掃描工作還是持續在進行著。稍稍回顧一下一些之前的討論。

原文: One College Librarian Worries About ‘Atomizing’ Books

ALA 主席 Michael Gorman 批評 Google
他認為學術研究對如Google之類的搜尋引擎的利用越來越普及,會對學術研究造成不好的傷害。因為:

  1. 搜尋引擎就算加入許多圖書館的內容(指Google print library project),也不會在內容上超越傳統的圖書館;Google只能摘錄少部分受智財權保護的著作,因此較不具價值;
  2. Gorman 認為 Google 並不是在「數位化」書本,他們是把書本「原子化(they’re atomizing them)」,把書本打散為段落與句子(Gorman客氣了,全文檢索是把資料拆解成一個個字了),而把內容從可以理解的情境中抽離出來;這對於研究來說會造成不好的影響。

Continue reading “Michael Gorman 對 Google print library project 的反對意見”

唸書筆記:metadata

  • 定義: 一組結構化的元件或項目(structured data elemnets),並且從其用途的方面,認為metadata是用於描述物件(Object),作為該物件之representation或 surrogate,並配合其他機制將物件組織成一套系統
  • Metadata的種類
  • metadata的功能
  • metadata與圖書編目的比較
  • metadata的要素
    • 項目(含其名稱及著錄內容)- Semantic
    • 呈現方式(含其結構與次序)- Structure
    • 敘述的語法 – Syntax
  • metadata 的限制
  • metadata on the WWW

詳全文:http://www.xxc.idv.tw/oddmuse/wiki.pl/MetaData

最後一項應該還要補充RDF、microformat的發展

圖書館服務與Blog (Leach and Levine)

之前介紹的Michael Leach演講,前一陣子梁董處也先一步發表了這場演講的心得與摘要,今天知道已經有主辦單位提供的演講的簡報檔與會議記錄可以下載了
這兩天的演講有很多精采的內容,不過不能免俗的,Blog, Wiki, RSS 在圖書館的應用可能是大家最近比較關心的話題吧。
另外,在八月The Shifted Librarian的Jenny Levine也為了 Northeast Kansas Library System 作了一份關於社會性技術的簡報,這份長達216頁的簡報所講的內容,除了前述的Blog, Wiki, RSS之外,也介紹了對Instant Messaging, Bookmark Managers, Flickr, Folksonomies 等服務的應用。Jenny 跟她的 Blog: The Shifted Librarian,可能是圖書館界中最有名的,光看http://www.bloglines.com/ 中RSS訂閱的數字就高達 6,591。
我想,這些對於新技術的介紹,算是為這些新技術增加了許多將來應用的可能。不過,就像有次跟梁董聊過,我並不完全認為圖書館應用Blog,只像是當一個新的留言版或是新的內容管理技術來思考。這些新技術背後所影含,對於社會與傳播行為的改變,才可能是圖書館經營上更需要思考的題目;單單只針對技術本身,容易陷入工具定律(the law of the instrument)的思維中
*工具律(the law of the instrument) *
http://www.people.vcu.edu/~mikuleck/courses/measure/sld002.htm
Give a small boy a hammer, and he will soon discover that the entire world needs pounding.
給小男孩一個槌子,他會發現整個世界都需要被敲一敲。

跟宗曄介紹國家圖書館新的博碩士論文系統(兼podcast test)

一日,跟跟宗曄介紹國家圖書館新改版的博碩士論文系統。因為多了分析功能,檢索時可以下較為普遍模糊的詞,再按照學科分類與時間兩個面向看檢索的結果,十分方便。
另,原來我們念圖書資訊學的,是分到「大眾傳播學類」下面啊…..
Download podcast
註:本篇是第一篇podcast測試,又經過兩個小時奮鬥以後,才把podcast模板與FeedBurner調整好。 XXC@Blog podcast

圖資界blogger看過來, Michael Leach演講

前幾天才開始ARIST共讀,結果美國資訊科學與技術學會(ASIST)會長暨哈佛大學物理圖書館館長Michael R. Leach這幾天就剛好來台灣演講。
第一天(7/25)是與台大圖書館項潔館長談「網路環境下大學圖書館的發展趨勢」,Mr. Leach 先生以哈佛圖書館為例,項潔館長當然以台大圖書館為例了。
不過大家希望也不要錯過第二天 7月26日(週二)Michael R. Leach 的「Blogs, Wikis, RSS Feeds: How the new wave of Technology is Affecting Communication in Academic, Information Societies」與「The Development of Web Resources」。有趣的是,主辦單位的中文題目是「新傳播科技對圖書館的影響」,不過似乎Mr. Leach 的題目並沒有看到Library(圖書館)的字眼?
地點在國家圖書館簡報室,這是演講的詳細資料
此處可下載報名表,詳情可洽美麗的戴筱蓁小姐,電 話:(02)2351-3968轉 15 e-mail:evelynn在town.glis.ntnu.edu.tw

Jul-13 ARIST共讀,第一次聚會

後來我才發現,整個聚會最重要的就是抽引言的順序;而這是小蔡先想到要作的。

不過扣掉程序上應該做的事情,能跟不同學校的同學閒聊彼此學校間的差異—雖然都是相同科系的—覺得可以開拓自己的視野。畢竟我們通常都以為自己在學校裡面所學與所作的是必然的,但是稍稍瞭解一下其他學校的事情,往往會感覺到許多平常無法察覺的差異。

至於什麼是ARIST?全名是 Annual Review of Information Science and Technology. 是美國資訊科學學會(American Society of Information Science)所出版的年度刊物,通常會根據當年較具有代表性的主題進行探討評論;每一篇文章都由代表性的學者整理回顧相關重要研究的文獻與結果。
如果相關的主題剛好是我們所感興趣的,那麼該篇也就幫我們掌握了不少重要的文獻了。這也是挑中ARIST的原因吧。
不過畢竟每篇篇幅都很長,只有一個人一週不知道夠不夠?反正到時候再說了。

下次應該弄個相機拍照留念。

目前時程如下:
(1) 7-20 小蔡: ICT’s and Political Life (2004-ch9)
(2) 7-27 彩惠: Labor in Information Systems (2005-ch13)
(3) 8-03 阿亮: Interface Design and Culture (2005-ch15)
(4) 8-10 佳融: Poststructuralism and Information Studies (2005-ch14)
(5) 8-17 立秀: New Theoretical Approaches for HCI (2004-ch2)
(6) 8-24 小杯: Preservation of Digital Objects (2004-ch11)

(ps. 我在 43Things 有開這個讀書會的主題,你也許注意到了,我這篇是從43Things log過來的。歡迎有興趣的加入 )

Reorganize my Bloglines

一、為了更方便使用。因為我是個懶人,每天都要用Bloglines,所以重新整理比較不會找東找西的。
因為Bloglines的分類還是樹狀結構的,而且只有一層。因此也只能透過分類標題來作管理。
Bloglines 最上層的排序只有預設的A-Z一種而已,可是也可以自訂排序的順序。要不要使用自訂的排序順序看個人習慣。分類內的項目可以設定四種不同的排列次序:根據A-Z/Z-A的字母次序;根據未閱讀的數量;根據收錄的時間;與不排序,也就是使用自訂的排序順序。
我比較喜歡透過A-Z來排。這樣我想到什麼概念的時候,還可以根據有規則的順序找到主題。
運用集中的原則:透過對於分類標題的分層命名,將相關性的分類集中起來。這從圖書館課程中所學到的各種主題分析的標題表做法,如Sears Subject Heading, LCSH 的練習中可以獲得許多有用的做法與知識。

二、為了減少資訊焦慮,看到每天一堆unread心情會不爽。而且人認知的注意力是有一定的範圍的,每天就是只能注意那一點東西,反正其他的都是忽略掉的。最簡單的方法就是砍掉,資訊捨用跟資訊取用一樣重要,唯有智慧才能斷除煩惱,砍吧。不過有時候這只是說來自己爽的,最後還是只有砍掉少許…..

http://www.bloglines.com/public/XXC

index paper 進展

  • * 一邊看paper一邊跟著引文資訊往外探索的結果,是把文獻清單增加到52篇
  • Mai(2001)的這篇 ,從符號學(Semiotics)的角度探討主題索引的編製程序。其中這句話最值得摘錄:「但是傳統典型的索引編製程序並沒有意識到,索引並非是文件主題中立且客觀的呈現,而是為文件預期的使用所作的詮釋。(Indexing is not a neutral and objective representation of a document’s subject matter but the representation of an interpretation of a document for furture use.)」。我想這也是Mai這陸續研究以來的觀點。
  • Hert, Jacob,及 Dawson三人這篇. ,是對四種不同的網頁的索引頁面結構方式,進行使用性分析。是一篇結合索引評估與使用性評估的實證研究。感覺上很像資訊架構學(information architecture)所作的事情,只不過作者並沒有使用這樣的詞彙術語而已。

Farrow, J. (1996). Propositional analysis and macrorules for indexing

form Library Review, 45(1), 6.

Farrow 介紹由心理語言學中的「命題分析(propositional analysis)」與「巨集規則(macro-rule)」,並應用心理語言學的分析法,來進行索引編製工作中的索引詞彙選擇。

命題分析將文本中的句子視為由命題(proposition)所組成的論述。因此透過命題分析來理解文本的結構。
而巨集規則(macro-rule)是由Kintsch 與Van Dijk 在1978年所提出來,認為人的心智能利用五種巨集規則,將閱讀時停留在短期記憶中的命題組合成為巨集命題(macroproposition)。這五種巨集規則分別為:

  • 弱刪除(weak deletion): 刪除意外的資訊;如,不改變意義的細節。
  • 建構(construction): 整合資訊中的屬性、子項、因、果,以產生更高階的事實。
  • 概化(generalization): 將事物或屬性透過上層概念應用到相同上層概念底下的其他事物。
  • 強刪除(strong deletion): 刪除與自身情境相關的資訊,使資訊能指陳一般性或預期的關聯。
  • 歸零(zero): 清除贅餘,只留下相關且符合巨集結構的資訊。

因為命題分析與巨集規則模型相當繁瑣,因此Kintsch 與Van Dijk在1983年發展了另一種較有彈性的模型,可根據可察覺的線索與文字脈絡分析,而不必完全逐字逐句分析文本。這種模型稱為巨集策略(macro-strategy)。

Farrow認為命題分析的成本太高,並且只分析文字本身,而忽略了文本與傳播的面向;例如無法取出文字的言外之意。命題分析能完整的說明文字的要點,但實際上只能應用在短篇的文字。

Milstead, J. L. (1994). Needs for research in indexing

form Journal of the American Society for Information Science, 45(8), 577.

Milstead提到近來研究者感興趣的研究方向,是走向以自然語言檢索為主(雖然是1994年的文章,但是相當程度上也說明了一般人理解的現況),而非人為的索引與摘要服務。相關的研究也逐漸減少(1980-1990)。

另一方面,Milstead認為索引研究對於使用者與索引者行為的了解仍然不足。也歸納了相關研究的方向。有:

  • 認知面向:包含編撰索引時的認知過程,與進行檢索時的認知過程。
  • 控制詞彙:索引典的詞彙關係,索引典大小,控制詞彙與自然語言的平衡
  • 機器輔助編製索引與檢索,包括以下研究:相關詞彙系統,索引資訊工具,結合人為索引與自然語言檢索,自動分類系統
  • 編排與索引結構
  • 索引工作評估:包含檢索評估,使用性測試,與評估索引工作的價值。

其中,對編製索引的認知過程,引用Shaw & Fouchereaux (1993)的看法,認為編製索引有兩個基本程序:(1)決定應以什麼「有關的(about)」文字或資訊來回答索引問題;(2)將此決定轉譯成為索引系統的詞彙,以控制詞彙或是以自然語言。第二個步驟已可以準確的描述其做法,但是對於第一個步驟,索引者如何決定哪些詞彙是「有關的(about)」,或是如何可以使用者確認這樣的詞彙可以滿足使用者的檢索需求,這些都還不了解。

====

  • 很久以前的論文啊?它後面的reference很多台灣還找不到,….才1991年的耶….。
  • 這些研究面向,在十年來許多已經有不同的面貌。
  • 其中可能是最重要的一本書是 Indexing, Providing Access to Information: Looking Back, Looking Ahead : The Proceedings of the 25th Annual Meeting of the American Society of Index by Nancy C. Mulvany。台灣沒有,有人最近要從美國回來嗎?