Powerset vs Cognition: 語義搜索對決
作者: its
|
發布: 2008/6/8 (下午 08:19)
|
閱讀: 25577
|
評論: 0
|
靜態地址
|
內容源碼
語義搜索引擎 Powerset 以對 Wikipedia 進行搜索,并在搜索結果中包含語義相關內容展示著稱,Cognition Technologies 是另一種語義搜索技術,本文通過一些搜索示例,對二者的語義搜索技術以及 Google 搜索進行對比。
示例 1: Powerset
Powerset 可以在某些搜索形式中大放異彩,比如,對一些需要從數據集中對內容進行抽象與聚合的搜索,下面的搜索示例中,Powerset 對用戶尋找的信息進行了非常出色的總結并以很漂亮的形式進行展示。
“military intelligence”
“teams in the NFL”
示例 2: Cognition Technologies
另一方面,有另一種形式的搜索,牽扯到對語義的剖析,這種搜索會讓 Powerset 感到疑惑,Cognition 卻能得到更好的結果。
“rare wildlife of the Amazon”
“football players who went to jail”
示例 3: Google
有一些搜索(尤其是不牽扯語義剖析的場合),Google 的結果遠遠好過 Powerset 與 Cognition:
“helicopter carrier Iwo Jima class”
以上的搜索,Google 返回了最佳結果,Powerset 返回了相關結果,Cognition 則徹底糊涂了。
消除歧義
搜索領域的一個難題是語言的歧義,在這方面,Powerset 和 Cognition 勝過 Google,比如,當用戶輸入 Java 這個搜索詞,他真實的意思是什么?是那個 Java 島,還是 Java 編程語言,還是指咖啡? Google 最近在這方面做了一些試驗,但 Powserset 和 Cognition 做得更好。
當 Powerset 發現歧義,會使用 Tab 對結果進行區分:
Cognition 處理方式不同,會允許用戶從不同的語義中選擇:
對用戶的影響
對絕大多數普通搜索,Google 做得已經夠好,我們已經習慣基于關鍵詞的搜索,在這種搜索模式下,Google 龐大的資源,廣泛的索引,基于 PageRank 算法的獲得恰當結果的強大威力,讓別的搜索引擎根本沒有辦法超越,用戶在一些特別搜索情形可能需要一些努力,但絕大多數用戶會接受。事實上,Google 已經成了搜索的代名詞,就象 Xerox 代表復印一樣。
未來的競爭
既然這樣,Powerset (以及 Cognition)將如何吸引用戶?
Clayton Christensen 與 Michael Raynor 在他們的新書《The Innovator’s Solution》中,談到創新公司如何挑戰市場領先者與既有的消費習慣并獲得成功。他們認為注定會失敗的一個方法是這些小公司企圖超過那些市場巨頭。相反,他們建議使用以下兩種方法進入區分市場。
- 新市場策略:吸引那些新用戶并為他們培育整體市場。
- 低端策略:有一些用戶對價格比較敏感,愿意犧牲一些功能換取低價。
換句話說,這些新公司必須從那些市場巨頭的夾縫中發現商機,因此,同 Google 正面交鋒將毫無希望,Google 會不惜一切代價反擊,同時,因為 Google 是免費的,所以上面說的低端時常策略也沒用。
新市場策略如何?任何上網的用戶都已經在用某種搜索引擎(而 Google 占絕對優勢),然而,Google 一直以來都遵循著一些原則:簡單的用戶界面,飛快的響應速度,以及結果的恰當程度,對這些原則進行分析,我們可以從中發現一些新的用例,比如:
-
-
響應速度:對于一些高級搜索,用戶可能并不在乎等待。試想有一個搜索服務機構,用戶提出復雜的查詢要求,這個搜索服務機構第二天向你提供完善的搜索結果,比如,你計劃做一次旅行,需要機票,酒店以及租車服務,你需要最低的費用,這些查詢適合剛才說的類型。
-
結果的恰當程度:雖然所有搜索引擎使用類似的標準保證恰當的結果(主要基于內容被鏈接的質量),有一些算法對某些類型的查詢肯定更好,社會媒體的相關程度是一個明顯的例子,著名內容加權也是一個例子。
本文國際來源:http://gigaom.com/2008/06/07/powerset-vs-cognition-a-semantic-search-shoot-out/ 中文翻譯來源:COMSHARP CMS 官方網站
|