index paper 進展

  • * 一邊看paper一邊跟著引文資訊往外探索的結果,是把文獻清單增加到52篇
  • Mai(2001)的這篇 ,從符號學(Semiotics)的角度探討主題索引的編製程序。其中這句話最值得摘錄:「但是傳統典型的索引編製程序並沒有意識到,索引並非是文件主題中立且客觀的呈現,而是為文件預期的使用所作的詮釋。(Indexing is not a neutral and objective representation of a document’s subject matter but the representation of an interpretation of a document for furture use.)」。我想這也是Mai這陸續研究以來的觀點。
  • Hert, Jacob,及 Dawson三人這篇. ,是對四種不同的網頁的索引頁面結構方式,進行使用性分析。是一篇結合索引評估與使用性評估的實證研究。感覺上很像資訊架構學(information architecture)所作的事情,只不過作者並沒有使用這樣的詞彙術語而已。

Farrow, J. (1996). Propositional analysis and macrorules for indexing

form Library Review, 45(1), 6.

Farrow 介紹由心理語言學中的「命題分析(propositional analysis)」與「巨集規則(macro-rule)」,並應用心理語言學的分析法,來進行索引編製工作中的索引詞彙選擇。

命題分析將文本中的句子視為由命題(proposition)所組成的論述。因此透過命題分析來理解文本的結構。
而巨集規則(macro-rule)是由Kintsch 與Van Dijk 在1978年所提出來,認為人的心智能利用五種巨集規則,將閱讀時停留在短期記憶中的命題組合成為巨集命題(macroproposition)。這五種巨集規則分別為:

  • 弱刪除(weak deletion): 刪除意外的資訊;如,不改變意義的細節。
  • 建構(construction): 整合資訊中的屬性、子項、因、果,以產生更高階的事實。
  • 概化(generalization): 將事物或屬性透過上層概念應用到相同上層概念底下的其他事物。
  • 強刪除(strong deletion): 刪除與自身情境相關的資訊,使資訊能指陳一般性或預期的關聯。
  • 歸零(zero): 清除贅餘,只留下相關且符合巨集結構的資訊。

因為命題分析與巨集規則模型相當繁瑣,因此Kintsch 與Van Dijk在1983年發展了另一種較有彈性的模型,可根據可察覺的線索與文字脈絡分析,而不必完全逐字逐句分析文本。這種模型稱為巨集策略(macro-strategy)。

Farrow認為命題分析的成本太高,並且只分析文字本身,而忽略了文本與傳播的面向;例如無法取出文字的言外之意。命題分析能完整的說明文字的要點,但實際上只能應用在短篇的文字。

Milstead, J. L. (1994). Needs for research in indexing

form Journal of the American Society for Information Science, 45(8), 577.

Milstead提到近來研究者感興趣的研究方向,是走向以自然語言檢索為主(雖然是1994年的文章,但是相當程度上也說明了一般人理解的現況),而非人為的索引與摘要服務。相關的研究也逐漸減少(1980-1990)。

另一方面,Milstead認為索引研究對於使用者與索引者行為的了解仍然不足。也歸納了相關研究的方向。有:

  • 認知面向:包含編撰索引時的認知過程,與進行檢索時的認知過程。
  • 控制詞彙:索引典的詞彙關係,索引典大小,控制詞彙與自然語言的平衡
  • 機器輔助編製索引與檢索,包括以下研究:相關詞彙系統,索引資訊工具,結合人為索引與自然語言檢索,自動分類系統
  • 編排與索引結構
  • 索引工作評估:包含檢索評估,使用性測試,與評估索引工作的價值。

其中,對編製索引的認知過程,引用Shaw & Fouchereaux (1993)的看法,認為編製索引有兩個基本程序:(1)決定應以什麼「有關的(about)」文字或資訊來回答索引問題;(2)將此決定轉譯成為索引系統的詞彙,以控制詞彙或是以自然語言。第二個步驟已可以準確的描述其做法,但是對於第一個步驟,索引者如何決定哪些詞彙是「有關的(about)」,或是如何可以使用者確認這樣的詞彙可以滿足使用者的檢索需求,這些都還不了解。

====

  • 很久以前的論文啊?它後面的reference很多台灣還找不到,….才1991年的耶….。
  • 這些研究面向,在十年來許多已經有不同的面貌。
  • 其中可能是最重要的一本書是 Indexing, Providing Access to Information: Looking Back, Looking Ahead : The Proceedings of the 25th Annual Meeting of the American Society of Index by Nancy C. Mulvany。台灣沒有,有人最近要從美國回來嗎?

Mai, J.-E. (2005). Analysis in indexing: Document and domain centered approaches

Analysis in indexing: Document and domain centered approaches.

Mai說明兩種索引法:文件中心法(document-centered)與領域中心法(domain-centered)。Mai認為文件中心索引的問題在於無法表現有關的情境因素。因此傳統的兩階段索引程序並不足夠處理這些複雜的情境,而建議改為以領域中心的索引法。

傳統的索引法都是以文件中心或是文件導向(document-oriented),即經由索引者,分析文件中主題(subject matter)作為索引詞(index term)。Mai認為文件導向的索引法的重點在於:(1)文件實體與其可徵信的描述,與(2)索引者應忠於本文與作者之主張。

但是文件導向的方法,並未考慮到不同使用者與不同的用途,因此Mai認為應該考慮由使用者與使用情境的角度來思考,並以Hjorland與Albrechtsen於1995年提出的領域分析(domain analysis)為基礎,建立新的領域中心的索引法。領域中心的索引法,需要分析文本,讀者,與索引者自己本身。即,索引除了考慮文本本身,還要考慮使用者的資訊需求,與索引者本身所扮演的角色。

====

  • Mai在這篇文章中,並未意圖建立「新」的索引法操作性規範,而是著重在進行索引工作時需要問出「對的問題」,索引者解決的問題需要包含領域情境中的各個面向,而非只是回到文本本身而已。
  • 在目前我所詢問到的書後索引現況,在台灣幾乎沒有專業的索引者;大多都是由作者直接給定詞彙,然後由編輯實際執行排版工作。由作者自己選定索引詞彙,的確是可能最接近文本本身作者意圖的工作方式;但是若以此文的觀點,這樣的給定索引詞彙,能否回應使用者的資訊需求,實在頗令人質疑。並且,雖然說這些索引詞彙多半是由作者直接給定,但是在台灣索引編輯的體例上,通常不會對索引者加以說明(不論是作者,或是由編輯擔任這項工作)。這使得台灣的書後索引看起來很「中性」「客觀」,彷彿由機器自動產生的一樣,沒有提供任何立場與情境。因此實際上對於交代或對索引工作者角色特性的了解都很缺乏。我想這大致上可以說明台灣書籍出版上,在索引品質上的問題。

search papers about indexing…

為了想找關於編製索引的論文,以下是經過了Google Scholar, CiteULike, CiteSeer, UMI Digital Dissertation, LISA的初步結果。 過程中也漸漸發現自己有興趣的是indexing process,而不只是indexing這個概念。

now I try to read them in this week…I hope so…..

  • Abbott, R. (2004). Subjectivity as a concern for information science: A popperian perspective. Journal of Information Science, 30(2), 95.
  • Al-Halimi, R. K. (2004). Mining topic signals from text. Unpublished PhD, UNIVERSITY OF WATERLOO (CANADA).
  • Barnum, C., Henderson, E., Hood, A., & Jordan, R. (2004). Index versus full-text search: A usability study of user preference and performance. Technical Communication, 51(2), 185.
  • Farrow, J. (1996). Propositional analysis and macrorules for indexing. Library Review, 45(1), 6.
  • Garshol, L. M. (2004). Metadata? Thesauri? Taxonomies? Topic maps! Making sense of it all. Journal of Information Science, 30(4), 378.
  • Jones, K. P. (1983). How do we index? A report of some aslib informatics group activity. Journal of Documentation, 39(1), 1.
  • Jorgensen, C., Jaimes, A., Benitez, A. B., & Chang, S. F. (2001). A conceptual framework and empirical research for classifying visual descriptors. Journal of the American Society for Information Science and Technology, 52(11), 938.
  • Lancaster, F. W. (2004). Indexing and abstracting in theory and practice. Technical Services Quarterly, 21(4), 97.
  • Mai, J.-E. (2000a). Deconstructing the indexing process. Advances in Librarianship(23), 269-298.
  • Mai, J.-E. (2000b). The subject indexing process: An investigation of problems in knowledge representation. Unpublished PhD, THE UNIVERSITY OF TEXAS AT AUSTIN.
  • Mai, J.-E. (2001). Semiotics and indexing: An analysis of the subject indexing process. Journal of Documentation, 57(5), 591-622.
  • Mai, J.-E. (2004a). The future of general classification. Cataloging and Classification Quarterly, 37(1/2), 3.
  • Mai, J.-E. (2004b). The role of domains, documents, and decisions in indexing. Paper presented at the Eight International ISKO Conference.
  • Mai, J.-E. (2005). Analysis in indexing: Document and domain centered approaches. Information Processing & Management, 41(3), 599.
  • Sauperl, A. (2004). Catalogers’ common ground and shared knowledge. Journal of the American Society for Information Science and Technology, 55(1), 55.
  • Schwartz, C., & Fry, B. M. (1977). Indexing behavior-survey and state of the art. In Anonymous (Ed.), Information management in the 1980s: Proceedings of the 40th asis annual meeting, volume 14 (pp. Chicago). White Plains: New York, American Society for Information Science.
  • Sensuse, D. I. (2004). A comparison of manual indexing and automatic indexing in the humanities. Unpublished PhD, UNIVERSITY OF TORONTO (CANADA), TORONTO.
  • Stubbs, E. A., Mangiaterra, N. E., & Martinez, A. M. (1999). Internal quality audit of indexing: A new application of interindexer consistency. Cataloging and Classification Quarterly, 28(4), 53.
  • Zhang, W. (2004). The development and structure of the chinese thesaurus for subject indexing. International Information and Library Review, 36(1), 47.

SRW: 下一代的Z39.50發展現況[數位圖書館期末報告]

題目定的很早。因為我不了解Z39.50是什麼。能有跨系統的檢索標準聽起來很棒,可是為什麼會沒什麼人用?有什麼問題?最新的發展是什麼?就是這點簡單的好奇心而已。
可是中間動念過無數次換題目的念頭。像是folksonomy啦,podcasting啦,Creative Commons啦,Institution repository啦,ATOM,RSS1, RSS2比較啦,等等,有趣的題目太多了,真是誘惑。
可是後來還是耐下心來寫完它,沒有見異思遷,喜新厭舊,這是第一個收穫。
另外,先用Mind Manager,加上EndNote,應用到新玩具來寫作業。可能是因為這兩個東西之前已經花了一段時間調適,雖然是第一次正式上陣,感覺還不差。這是第二個收獲。
至於文章本身麻….因為ZING Information Forum – June 2005馬上(24hr之內)就在Chicago開始了,所以馬上就會有更新的發展,真是一份壽命短暫的報告啊~~
Download file
Continue reading “SRW: 下一代的Z39.50發展現況[數位圖書館期末報告]”

做完口頭報告以後

這學期做完最後一個口頭報告:知識社會學的「Wiegand, W. A.(2003)圖書館研究的新方向」之後,雖然同學們覺得不錯,老師也沒有多修正什麼。下課以後,晚上快十點,真想找支煙;只是感覺上而已,可是我手上沒有,也沒有衝動到馬上去便利商店買一包。
覺得少了什麼。在家裡自己作報告的時候,就已經在一個人自問自答了;這樣寫好嗎?這邊可以這樣問個問題嗎?可是等到報告的時候,怎麼感覺還是我自己一個人?看著台下一張張臉孔,我在想是我少作了什麼?
人太多了吧,應該是。

編輯力

  • 經驗的觀點。但在不同時空背景下(時代不同,社會環境不同),有些看法也不一定非認同不可。
  • 目錄與小標(p. 147-155):說明編輯在處理作者書寫文本,到給讀者閱讀時,進行的編輯工作。是一個觀察的資料。「小標自始自終是站在讀者這邊的舉措,雖然是沿循作者的意向,但也同時考慮讀者容易閱讀的強制措施。」小標是編輯進一步幫助讀者理解作者文本的文字,但是小標的優劣該如何評估?如何編輯能成為「讀者需求」的代理人?有效用的小標如何可以發揮進一步的價值?
  • 讀書會 (p. 232-233): 作者參加一般讀書會與對大學讀書會的看法。「我猜大學恐怕已經沒有讀書會了吧。容易因為語言受傷或傷人的大學生,或許很難習慣直率發表感想的讀書會。」我一直感覺到多多少少,台灣也有這種情況;不過每個學校與班級的文化不同,甚至相同的班級在不同的課程上也有不同的溝通文化。
  • 書有未來嗎? 村上春樹的實驗 (p. 229-231): 介紹由村上春樹創意企劃的《海邊的卡夫卡》衍生的非書非雜誌刊物(mook?)《少年卡夫卡》,「模仿少年漫畫的封面和大開本,……收錄了村上春樹和《海邊的卡夫卡》讀者之間多達1220封的電子郵件。」我想,不管出版或是圖書的未來,不是有了什麼樣的技術,而是對人—不管是工作的人,或使用的人—產生了改變,而作出了想不到的事情,才是真正的未來。

相關連結

  • 看村上春树如何营销卡夫卡 http://www.csonline.com.cn/changsha/cbpl/t20030817_4429.htm
  • 《少年卡夫卡》書影 少年カフカ

勞倫斯‧卜洛克。《父之罪》

* 我在舊書交換的時候,換到了一本卜洛克的《一長串的死者》。當我這幾天想要看得時候,翻不到一頁,就感到一種抗拒感:厚度,份量,我知道卜洛克的史卡德系列的有名,我也喜歡唐諾的品味。我想可能是因為我不想從中間開始讀的關係,所以我去圖書館找了史卡德第一本《父之罪》。在GWO公司一邊安裝OSX Tigerㄧ邊讀完。

* 我讀到一半的時候,隱隱的連想到書名的父之罪,也許最有罪的是馬丁‧范得堡,因為我不喜歡他與他那被定罪的兒子的關係,我不喜歡那種強迫意味的道德觀。我不認為他會是兇手,只是單純的不喜歡。沒想到最後真的就是兇手。

* 我喜歡史卡德的態度,或者是說這本小說作為偵探小說的態度;它一開始不是在找出兇手是誰,不是為了解暗室殺人謎團,或是為了某種類型小說必然的正義感。它是為了要了解某種事情,某種在分類間搖擺,無法簡單被明白說出來的是是非非。我應該會很快去找下一本史卡德來看了。

曾慶豹(1998).哈伯瑪斯

我年初開始找哈伯瑪斯相關資料的時候,瑋泓介紹我一本由他學長寫的,關於哈伯瑪斯的專書。過了很久才借到,借到以後又被其他事左右著。這天小白再度送廠,往來修車廠數次,又在修車廠等候許久,唯一的收穫就是終於翻閱完這本書。
跟一般翻譯的原典,或是翻譯的專書不同,這本是由當代台灣學者寫的;我覺得雖然篇幅不多,但是反而容易了解哈伯瑪斯思想的輪廓;我想這也是因為作者能掌握原始思想的概念,所以才能將這些想法說的簡單明瞭。
另外,便利貼加上一隻筆也許真的可以幫助進入閱讀的狀況。