Wikipedia 將來能否成為一個開發平臺?
作者: its
|
發布: 2009/2/24 (下午 01:06)
|
閱讀: 30037
|
評論: 0
|
靜態地址
|
內容源碼
維基百科(Wikipedia)中的內容增長速度正在放緩,規模原本已經很小了的活躍編輯的數目也在下滑,Jimmy Wales 呼吁編輯們審查的內容越來越多,進一步阻礙了內容的增長。然而 Wikipedia 新鮮內容的減少并不意味著它的死亡,Wikipedia 擁有一個龐大的結構數據庫,這是一個尚未被發現的寶藏。
Wikipedia 中的數據有大量來自用戶創建,還有更多數據可供開發者進行分析。
上圖: 借助 Wikidashboard 瀏覽器擴展獲得編輯歷史記錄 Edit history
這個快速成長的由用戶貢獻內容的知識庫目前也許還處于青春期,Wiki 的發明者 Ward Cunningham 認為 Wales 要求審查內容的努力是一種不可避免的成熟表現,雖然這兩種情形他都未必喜歡,未必代表 Wiki 的方向。然而 Wikipedia 數量龐大的知識庫卻為開發者帶來了各種價值。
目前 Wikipedia 還沒有 API 提供,然而它的數據卻可以輕松訪問,可以被下載到本地進行處理,最近,一個叫做 WikiXMLDB 的項目開始推出 XML 化的 Wikipedia,另外值得一提的還有 DBPedia,該項目將 Wikipedia 中的數據轉換成結構數據庫。人們開始用各種各樣的方式訪問這些數據并發現了一些實用價值。如果 Wikipedia 能推出幾個正式 API,相信會像《紐約時報》推出 API 一樣讓人興奮。
人們可以拿 Wikipedia 的數據做什么?
將 Wikipedia 作為一個重要的知識源
早期,主流媒體談到 Wikipedia 的時候,多是對一些參與者感興趣,那些留著及膝長須,住在新墨西哥的流浪公園的家伙喜歡發一些關于天文或廚藝的文章。Wikipedia 幫助人們釋放出那些埋藏在大腦中的知識,對這些人系統地發掘只是建立在 Wikipedia 之上的眾多價值之一。
Palo Alto 研究中心最近設計了一個叫做 WikiDashboard 的程序,這個工具可以分析任何一篇 Wikipedia 文章最近的修改歷史。Paul Irish 曾是一個著名在線音樂博客站點的編輯,最近他設計了一個 Greasemonkey 腳本 可以直接在 Wikipedia 頁面訪問那些數據。
將 Wikipedia 作為新聞雷達
Wikipedia 對時事非常關注,一個叫 WikiRage 的站點根據 Wikipedia 文章被修改的頻度來衡量某個話題的重要性。RWW 曾推出這樣的文章,非廣告目的的數據挖掘將來會很盛行,以及 Facebook 的情感引擎會很大。Wikipedia 的編輯的頻度比起 Twitter 和 facebook 來說要小得多,但可能擁有很高的價值,最終會是社會媒體數據挖掘的一個重要補充。
最佳用例:平衡 Wikipedia 的結構數據
上個月,RWW 有篇文章提到,Google 好像在某些搜索結果中推出語義的結構數據,這些數據有的是 Google 自己分析的,有些很顯然來自 Wikipedia,這些結構化數據會帶來很多實用價值。
推薦服務網站 MSpoke 正在這樣做,這個商業新聞跟蹤服務使用 Wikipedia 訓練它的推薦引擎。MSpoke 的的 Sean Ammirati 說,Wikipedia 的內容澄清頁對幫助他們分清兩個邁克爾喬丹中哪個是籃球明星,哪個是統計學家非常有幫助。在商業推薦服務中,這些信息非常有用。
通過對 Wikipedia 大量詞匯的分析,MSpoke 已經可以快速理解他們從網絡上發現的文章。這也是 Metaweb 和 Powerset 一直在做的事,然而 Powerset 已經被微軟收購,而據傳聞 Metaweb 前景也不太妙。
Wikipedia 可以讓自己更多成為一個開放的數據庫,而不是一個供眾人修改的站點,也可能 Wikipedia 目前還沒有足夠流行到可以做出這樣的跨越,或者它的政治糾紛,以及熱情的衰退來得太早,到底怎樣只有讓時間來說明一切了。
本文國際來源:http://www.readwriteweb.com/archives/could_wikipedias_future_api.php 中文翻譯來源:COMSHRAP CMS 官方網站
|