DNAK + Google Desktop Search = 家戶式數位典藏系統? (links for 2005-08-09)

今天檸檬介紹了這個DNKA工具,可以在主機上的Google Desktop Search也能讓網路上其他電腦也可以搜尋得到資料。
我開玩笑說,要做「家戶式數位典藏」系統就是這樣了。

不過,因為不是所有檔案的內文,GDS都能分析,像是影像掃描的PDF文件。所以檔名的命名就很重要了
這讓我想起,之前發現P2P的網路上,許多檔案都出現了某些命名的規則。這些規則大致上都是把某些檢索可能有意義的詞彙,放在檔名上,以利於檢索。如此處介紹的eMule命名規則:

[國家][供檔者][類別][日期]檔名
例如:
[Taiwan][xrush][mp3][2004-04-03]陳明章_下午的一齣戲.rar

以後,當網友輸入上面任何一個關鍵字搜尋時,即可從檔名看出:
這是陳明章「下午的一齣戲」專輯,由台灣網友xrush於2004-04-03這一天所提供,
檔案格式為RAR壓縮檔。

這像是以檔案命名的方式,記載數位檔案主題的詮釋資料。能在P2P網路上蔚為風潮,看來這樣的方法具有相當的表面效度啊…

還有Philipz學習日誌: 用Google Desktop Search建立公司文件搜尋也介紹了許多其他同樣功能的工具。不過最後(在迴響裡)還是建議用DNKA。Download網路學習誌2005/8月號NO.61有個主題介紹Google Desktop Search,似乎也介紹了DNKA,有機會可以找來看一下。

xFolk, Chandler (links for 2005-08-04 )

How do I bookmark my links?

最近出現在我的Blog上的都是我在del.icio.us所作的link report啊…., 雖然有點無聊,而且我中間也考慮了,也真的停掉了一次。不過,我後來想想,這種流水帳本來也是log的本質之一吧。也沒有人規定blog一定要文采翩翩的。
不過我並不是所有的social bookmark都是用del.icio.us的服務。我還用了另外幾種。
del.icio.us 是目前知名度最高的 social bookmark,自從它的bookmarklet改版之後,我發現它能自動建議我 tag 的語意準確度越來越高了。我想如果他收錄的資料越來越多,它能由網路計量之類技術所推論出來的網路資源語義相關性為越來越好。del.icio.us的使用行為,我本來並沒有特別想過,但是後來因為有些網路文章資源,常常因為變動而消失,因此我目前我拿只它來記錄網站資源的網路位置。
Furl的特點是他可以把網頁內容保存起來,而del.icio.us只有紀錄網路資源位置而已。所以我把內容、文章之類的用Furl紀錄,萬一某天對方網站關了還是搬家了,我還可以留有一份保存下來的內容可以看;而且Furl也很貼心的提供了APA, MLA, Chicago 等citation 格式,與 BibTeX, RIS/EndNote 的書目資料匯出,對我使用網路資源作文獻管理幫助比較大。
另外還有兩個學術資源管理的social bookmark服務,是我有在使用的。一個是D-Lib介紹過的Connotea,另一個是CiteULike。這兩個學術性的social bookmark都提供了書目管理資料(RIS)的匯出匯入功能,可以跟研究者的EndNotes等書目管理軟體配合使用,不同的地方是,Connotea設定是以網路上可大家都可取得的網路資源為主,而CiteULike是以網路上的電子期刊資源為主,所以各自都提供了一些工具來協助使用者。我使用者兩種social bookmark來管理學術性的網路資源。不過其實也不太好區分,有的時候只好兩個都用,有的時候只用一個,那個用的多就看運氣了。
我有個希望是,這些網路服務都會像del.icio.us, Flickr, 43 Thing一樣,提供XML-RPC的功能,讓內容可以彙整到blog裡面來。我可是一直認為XML-RPC是 Blog的三大神器之一啊。
另一個希望是,這些不同的network social bookmark可以有所整合的,像是Harold Davis 在他的Blog文章「Towards a Universal Tagging Standards」也希望有個標準,中也提到了xFolk這樣的標準。
xFolk, 根據 The Community Engine Blog: xFolk: An xhtml microformat for folksonomy的說法是:「xFolk is an open xhtml microformat that allows users to publish their own folksonomy classifications for aggregation by the services they choose. As such, it starts to give back users control of their own data. A side benefit of xFolk is that users may designate explicit semantics for their folksonomy tags, providing a link to the more formal practices of information architects.」也就是說,一方面希望透過標準將資料實際的控制權轉向使用者自己,另一方面確保不同social bookmark服務中的語義一致性。像我現在就覺得我所有的這四種social bookmark的tagging不一致很傷腦筋。
也許將來可以透過標準,將不同的social bookmark資料整合?看來還蠻有趣的,繼續觀察。不過我不像Harold Davis那樣希望把不同類的tag整合起來;他希望的是像是del.icio.us, 43 Things, Flickr等等都可以整合起來用;而我自己使用的情況,這些不同的服務不同,我下關鍵字tag的語用情境也不同,不像同樣是bookmark的時候,語義上的一致性那麼強。