Mai, J.-E. (2005). Analysis in indexing: Document and domain centered approaches

Analysis in indexing: Document and domain centered approaches.

Mai說明兩種索引法:文件中心法(document-centered)與領域中心法(domain-centered)。Mai認為文件中心索引的問題在於無法表現有關的情境因素。因此傳統的兩階段索引程序並不足夠處理這些複雜的情境,而建議改為以領域中心的索引法。

傳統的索引法都是以文件中心或是文件導向(document-oriented),即經由索引者,分析文件中主題(subject matter)作為索引詞(index term)。Mai認為文件導向的索引法的重點在於:(1)文件實體與其可徵信的描述,與(2)索引者應忠於本文與作者之主張。

但是文件導向的方法,並未考慮到不同使用者與不同的用途,因此Mai認為應該考慮由使用者與使用情境的角度來思考,並以Hjorland與Albrechtsen於1995年提出的領域分析(domain analysis)為基礎,建立新的領域中心的索引法。領域中心的索引法,需要分析文本,讀者,與索引者自己本身。即,索引除了考慮文本本身,還要考慮使用者的資訊需求,與索引者本身所扮演的角色。

====

  • Mai在這篇文章中,並未意圖建立「新」的索引法操作性規範,而是著重在進行索引工作時需要問出「對的問題」,索引者解決的問題需要包含領域情境中的各個面向,而非只是回到文本本身而已。
  • 在目前我所詢問到的書後索引現況,在台灣幾乎沒有專業的索引者;大多都是由作者直接給定詞彙,然後由編輯實際執行排版工作。由作者自己選定索引詞彙,的確是可能最接近文本本身作者意圖的工作方式;但是若以此文的觀點,這樣的給定索引詞彙,能否回應使用者的資訊需求,實在頗令人質疑。並且,雖然說這些索引詞彙多半是由作者直接給定,但是在台灣索引編輯的體例上,通常不會對索引者加以說明(不論是作者,或是由編輯擔任這項工作)。這使得台灣的書後索引看起來很「中性」「客觀」,彷彿由機器自動產生的一樣,沒有提供任何立場與情境。因此實際上對於交代或對索引工作者角色特性的了解都很缺乏。我想這大致上可以說明台灣書籍出版上,在索引品質上的問題。

search papers about indexing…

為了想找關於編製索引的論文,以下是經過了Google Scholar, CiteULike, CiteSeer, UMI Digital Dissertation, LISA的初步結果。 過程中也漸漸發現自己有興趣的是indexing process,而不只是indexing這個概念。

now I try to read them in this week…I hope so…..

  • Abbott, R. (2004). Subjectivity as a concern for information science: A popperian perspective. Journal of Information Science, 30(2), 95.
  • Al-Halimi, R. K. (2004). Mining topic signals from text. Unpublished PhD, UNIVERSITY OF WATERLOO (CANADA).
  • Barnum, C., Henderson, E., Hood, A., & Jordan, R. (2004). Index versus full-text search: A usability study of user preference and performance. Technical Communication, 51(2), 185.
  • Farrow, J. (1996). Propositional analysis and macrorules for indexing. Library Review, 45(1), 6.
  • Garshol, L. M. (2004). Metadata? Thesauri? Taxonomies? Topic maps! Making sense of it all. Journal of Information Science, 30(4), 378.
  • Jones, K. P. (1983). How do we index? A report of some aslib informatics group activity. Journal of Documentation, 39(1), 1.
  • Jorgensen, C., Jaimes, A., Benitez, A. B., & Chang, S. F. (2001). A conceptual framework and empirical research for classifying visual descriptors. Journal of the American Society for Information Science and Technology, 52(11), 938.
  • Lancaster, F. W. (2004). Indexing and abstracting in theory and practice. Technical Services Quarterly, 21(4), 97.
  • Mai, J.-E. (2000a). Deconstructing the indexing process. Advances in Librarianship(23), 269-298.
  • Mai, J.-E. (2000b). The subject indexing process: An investigation of problems in knowledge representation. Unpublished PhD, THE UNIVERSITY OF TEXAS AT AUSTIN.
  • Mai, J.-E. (2001). Semiotics and indexing: An analysis of the subject indexing process. Journal of Documentation, 57(5), 591-622.
  • Mai, J.-E. (2004a). The future of general classification. Cataloging and Classification Quarterly, 37(1/2), 3.
  • Mai, J.-E. (2004b). The role of domains, documents, and decisions in indexing. Paper presented at the Eight International ISKO Conference.
  • Mai, J.-E. (2005). Analysis in indexing: Document and domain centered approaches. Information Processing & Management, 41(3), 599.
  • Sauperl, A. (2004). Catalogers’ common ground and shared knowledge. Journal of the American Society for Information Science and Technology, 55(1), 55.
  • Schwartz, C., & Fry, B. M. (1977). Indexing behavior-survey and state of the art. In Anonymous (Ed.), Information management in the 1980s: Proceedings of the 40th asis annual meeting, volume 14 (pp. Chicago). White Plains: New York, American Society for Information Science.
  • Sensuse, D. I. (2004). A comparison of manual indexing and automatic indexing in the humanities. Unpublished PhD, UNIVERSITY OF TORONTO (CANADA), TORONTO.
  • Stubbs, E. A., Mangiaterra, N. E., & Martinez, A. M. (1999). Internal quality audit of indexing: A new application of interindexer consistency. Cataloging and Classification Quarterly, 28(4), 53.
  • Zhang, W. (2004). The development and structure of the chinese thesaurus for subject indexing. International Information and Library Review, 36(1), 47.

SRW: 下一代的Z39.50發展現況[數位圖書館期末報告]

題目定的很早。因為我不了解Z39.50是什麼。能有跨系統的檢索標準聽起來很棒,可是為什麼會沒什麼人用?有什麼問題?最新的發展是什麼?就是這點簡單的好奇心而已。
可是中間動念過無數次換題目的念頭。像是folksonomy啦,podcasting啦,Creative Commons啦,Institution repository啦,ATOM,RSS1, RSS2比較啦,等等,有趣的題目太多了,真是誘惑。
可是後來還是耐下心來寫完它,沒有見異思遷,喜新厭舊,這是第一個收穫。
另外,先用Mind Manager,加上EndNote,應用到新玩具來寫作業。可能是因為這兩個東西之前已經花了一段時間調適,雖然是第一次正式上陣,感覺還不差。這是第二個收獲。
至於文章本身麻….因為ZING Information Forum – June 2005馬上(24hr之內)就在Chicago開始了,所以馬上就會有更新的發展,真是一份壽命短暫的報告啊~~
Download file
Continue reading “SRW: 下一代的Z39.50發展現況[數位圖書館期末報告]”

音樂企業系統失靈

遊走…觀察…紀錄…:值得探討的現象:為啥來看《貢寮 你好嗎?》的人這麼多?中提到,2004年9月號第47期《誠品好讀》作了「獨立青年,音樂創業」專題,馬世芳受訪時舉的例子:

現在所謂主流、非主流,地上和地下,商業和非商業,界線非常模糊。唱片市場萎縮到這個地步,唱片公司花一、兩千萬買媒體廣告,最後唱片只賣出七、八千張;我們的《拜金小姐》只花兩萬元印新聞稿、付通告間的餐費,也一樣賣出七、八千張,你說誰才是主流、誰是非主流?

我想到從另一個角度來看mp3的興起,除了視為科技對於智財權的侵犯危機以外,更可能表徵了一種「現代企業系統失靈」的現象。由製作公司,發行公司,到大眾傳播媒體這樣組成的一個企業系統漸漸喪失它在當代社會中的執行效率;或是說另一個更能掌握當代資訊社會的系統漸漸的變的更有效。從這種角度來省思,對於智財權保護的討論,是否應該要考慮不偏向保護舊的生產系統而壓抑另一種社會生產系統的發展性。torrent所提到的紀錄片宣傳模式,也是他觀察到現象。
Continue reading “音樂企業系統失靈”

5th Annual Search Engine Watch Awards

由 SearchEngineWatch (小蝶老師上課有提過)所公佈的第五屆年度搜尋引擎觀察獎,這個獎項由網站的訂戶投票,最終由編輯評選而定。
這項評鑑中,可以發現,Google並非是唯一的冠軍,相反的,Google在許多方面都受到重大的挑戰。例如最具指標性的「年度出搜尋引擎」的項目,便由Yahoo取得,而非Google。雖然在這個項目,Google仍然得到大多數的使用者選票,但是編輯群認為Yahoo一年來在許多檢索功能的層次作了重大的改善,特別是Yahoo在他的眾多服務中垂直整合的努力,為了Yahoo的搜尋服務帶來了許多有價值的內容。
而Google沒有得到這個獎的最大原因,是因為去年Google去年11月承認 Image服務的資料庫資料已經數月沒有更新過了。對於這些挑剔的搜尋引擎專家們,這種管理上的錯誤的確是不可原諒的 — 雖然對於我們這些庶民可能分不出來。
http://searchenginewatch.com/awards/article.php/3494141
Continue reading “5th Annual Search Engine Watch Awards”

Hammond, T. and et al.(2005).Social Bookmarking Tools (I). D-Lib, 11(4).

Social Bookmarking Tools (I) – A General Review
http://www.dlib.org/dlib/april05/hammond/04hammond.html

社會性書籤工具 – 概述

網路書籤(bookmark/favorite)跟瀏覽器,超連結一樣,都是行之有年的網路概念產品。每個人都在自己的瀏覽器裡面,記錄了相當多的書籤資料。我也認識一些「專業級網路瀏覽者」,像是以前跟工頭同事的時候,他的網路書籤一直是我們覬覦的資料內容。這些個人的「數位圖書館」—根據這篇文章的說法—通常運用了一些管理的工具與方法。早期就不外乎存檔,在目錄中進行分類管理;偶爾我們也會為了如何同步公司電腦與家中電腦的書籤而傷過腦筋。早期就有一些在網路備分書籤的工具,我記得我就有用過yahoo, 與一些網路名片有類似的備份服務。一直到2005年, 所謂「社會性網路書籤工具」(social bookmarking tools), 才開始為大家所熟識。對我來說,這份文章認為開始網路書籤的時間可能晚了一點,其實在2004年del.icio.us就引起不少網路使用者的注意了,只不過當時大家(主要是bloggers)的認知主要是放在「社會性軟體」(social software)上。
這篇文章也認為,社會性網路書籤興起的原因,其一就是因為社會性網路的風潮,另一個就是「標籤」(tagging),與使用者分類(user classification)的風潮。文中稍後也提到bookmarklet的使用,我認為這個因素也是這樣的social bookmark可以成功的重要因素,因為使用者建立資料的usability變得很好,也就是說成本變得很低,以致於bookmark與tagging資料量可以很快的成長到critical mass.
文中回顧了一些在網路上建立公共分類目錄的計畫,像是DMOZ , 與Zeal 這兩個。我覺得這兩個都是為了解決使用者尋找網路資源的問題,而產生的網路計畫或是服務,包括Yahoo的網路分類也是。

文中主要形容這些社會性書籤工具主要是用「標籤」(tagging)的方法,由下而上,不像以往的資訊組織,如分類法,是由上而下的進行分類組織的工作。並且,「標籤」形成的是一個分散的網路關係,而非一個結構性的樹狀結構。
另一個重要的社會性書籤工具面向就是使用者的參與。並且,透過個人的參與,使用者可以辨識出與自己取向相近的知識系統。作者認為,這正是一個強調「普遍性」的網路搜尋引擎所沒有辦法辦到的事情。”Search engines, at this point, tend to index and search a global space – not my local space. My space comprises the documents I am interested in and the documents of other users that I want to follow.”
另一個社會性面向的議題是隱私權與匿名性。作者認為公開的書籤工具並沒有針對匿名性與隱私權的保證。另一個可能的危機就是標籤spam的可能性。spam已經對許多社會網路,如email, blog comments and trackback 造成了許多不良的影響,而開放的bookmark tagging 可能會步上下一個後塵。
文中認為需要透過某些機制整合不同的書籤工具,如(連結語法)linking syntax,API,這裡作者提出的是 RSS, 也舉了43 Things 作為整合不同網路書籤的範例。

在結論部分,文章總結了社會性網路書籤工具的幾個特點:

  • 個人帳號(有時候也會提供社群功能)
  • 加入連結、標題與說明的機制
  • 提供瀏覽器 bookmarklets 或其他的便利功能
  • 以標籤來分類
  • 可以依照標籤或使用者來搜尋(有時候提供布林的功能)
  • 可以依照熱門程度,使用者,標籤等查詢連結
  • 提供RSS
  • 提供瀏覽器外掛功能

最後的附錄也附上相關的社會性網路書籤工具列表。

translate from wikipedia: Indigenous knowledge : 本土知識, 在地知識

Indigenous knowledge : 本土知識, 在地知識
本土知識是指應用在特定文化中的知識。
一些定義:

  • 由口授傳統中取得的知識 (Waiko, 1997).
  • 本土知識是隨著地方或社會,獨特的,潛藏在文化中的。將本土知識由其發生的人為媒介與情境中抽離出來,會迅速的剝奪其意義與固有價值。(提出)本土知識的是為了連結全球(總體的)與地方知識,而非將地方知識轉為全球(總體的)知識 (Teasdale & Rhea, 2000).
  • 基於地方傳統與文化的知識系統 (Teasdale & Rhea, 2000).
  • 本土知識在開發中國家的資訊中包含了農藝,人與動物的保健,對於自然資源的管理,農村的發展,教育,與貧困的舒解。 (Teasdale & Rhea, 2000).
  • (本土知識)並非使整體碎列為日益變小的概念位元。(本土知識)認為是人類的思想,感覺,與溝通在整體中是不可避免的受到事件與過程所糾纏,而非只是其中的一小部份 (Suzuki, 1993).
  • 本土文化通常是指(堅持於)基於土地傳承的非工業文化,就算有些是屬於移民或是被強迫性的遷移。從非常簡單的物質生活,或是到複雜的社會都市/農業系統,像是印加文明或阿茲特克文明,都是本土文化 (Sahtouris, 1995).

From http://en.wikipedia.org/wiki/Indigenous_knowledge

Hayek. The use of knowledge in society

報告結束了。在最後三天我希望的是能夠整理的更簡單一點,更掌握重點一點;並且希望同學不要睡著….好像這些目的都有達成的樣子,還好。
這篇文章我第一次讀是1999年,對我影響很大,也對我當時的工作影響很大。回頭想想,也許我那時候理解到,而作出工作組織上改善概念比較像是在解決「資訊不對稱」的問題,但是也畢竟充分運用到了分散的個人知識。所以從此以後開始看海耶克的書,並且開始願意接觸經濟學—不過當然是沒有複雜數學的部分。
課程報告內容在:Hayek (1945). The use of knowledge in society

在我的 wiki 中的 labeling 條目

寫了一些在我的wiki裡,
http://www.xxc.idv.tw/oddmuse/wiki.pl/Labeling

膽子不小,竟然覺得那本IA的書講的不夠好,所以增加了一些自己對labeling的看法。不知道到時候報告用的上嗎?

找到一張圖,暫時用來表示labeling

大致整理了部分相關的原典

==知識相關原典==
* 經濟理論和知識(1936) – 知識分工
* 分散在社會中知識的利用(1945) – 特定時間與地點的知識、分散的知識(分立的知識)、價格訊息機制
* 感覺的秩序(1952) – 自發秩序、默會知識、有限知識
* 知識的狂妄(1974) – 人類知識的有限性、知識的狂妄
http://www.xxc.idv.tw/oddmuse/wiki.pl/Friedrich_A._Hayek#%e7%9f%a5%e8%ad%98%e7%9b%b8%e9%97%9c%e5%8e%9f%e5%85%b8