全面了解 Powerset
作者: its
|
發布: 2008/5/13 (上午 06:53)
|
閱讀: 28086
|
評論: 0
|
靜態地址
|
內容源碼
人們期待已久的自然語言搜索引擎 Powerset 終于亮相, Powerset 將改變人們從 wikipedia 搜索和發現資料的方式。基于 PARC 專利許可,以及專有的搜索技術的 Powerset 將是自然語言搜索技術的一種突破,它可以就任何主題或領域,從 wikipedia 的文章中抓取句子的含義。
這是 Powerset 改變人們消費網絡內容的第一步,與基于關鍵詞搜索的傳統搜索引擎不同,Powerset 嘗試理解句子的含義并進行匹配,以下是關于 Powerset 的發展歷程。
2006年10月2日
Matt Marshall 在 venturebeat.com 撰寫了一份聲明來吸引風險資金。
一個不容忽視的高科技創業公司,Powerset,即將獲得 1000萬美元風險資金對抗 Google
我們耳聞一個叫做 Powerset 的高科技創業公司,聲稱其搜索技術優于 Google。該公司由人工智能與自然語言技術專家 Barney Pell 創辦,他的業務創想已經深入硅谷的風險投資者。
接著,Pell 在他的博客中談了他的看法: Powerset與自然語言搜索
兩天以后,VentureBeat 就以前的聲明發表了一篇很長的更新,因為太長,我們只節選其中一部分:
關于 Powerset 與自然語言搜索的更多細節 Matt Marshall 2006年10月4號
我們說過會告訴你們更多 Powerset 的細節,這個不為人知的公司準備以一種新的搜索技術超越 Google。Powerset 的殺手锏是自然語言搜索,它會理解人們的自然語言。比如,如果你在 Google 中輸入“Books by Children”,Google 一般會忽略那個 "by",并搜索所有與 "books" 和 "children" 有關的頁面,因為沒有搜索引擎能理解句子中的語意,一些公司,如 Ask Jeeves,曾嘗試過,你可以以問句向 Ask Jeeves 提問,但如果你的問題太復雜,Ask Jeeves 就會無所適從,因為它只能回答事先準備好的特定問題。
雖然 Google 也知道自然語言的重要,卻沒有在這個領域獲得重大突破。這很好理解,正象 Powerset 的 Barney Pell 說的那樣,人們已經接受使用那些專門的搜索語言,就是關鍵詞語言。很多搜索引擎能夠識別一些高級查詢語法,比如,搜索那些不含某個關鍵詞的頁面,但人們并不容易記住這些搜索語法,而每個搜索引擎的語法各不相同。最終,Google 的核心引擎建立在這種關鍵詞語言上,而它們很難改變建立在這個基礎上的各個層面。
Pell 因此而來,Powerset 嘗試解決自然語言問題,將自然語言作為搜索的核心引擎,來理解時間,地點,語氣等等,他們并沒有給出確切的發布日期。
就在第二天,10月5日,搜索專家 Danny Sullivan 正式向 Powerset 提出質疑:
“那是癡人說夢,10年前就有人這么癡了,現在又輪到 Powerset。目前,那是一個你根本沒法使用的搜索引擎,但這些炒作無疑還會繼續。為了阻止這些行為,讓我來講講自然語言搜索的歷史。”接著 Danny Sullivan 用了非常長的篇幅,回顧了1995年以來的自然語言搜索歷史,因為太長,這里不再贅述。
現在,看看2008 年5月12日
Powerset 正式發布,這是 Powerset 改變人們消費網絡內容的第一步,與基于關鍵詞搜索的傳統搜索引擎不同,Powerset 嘗試理解句子的含義并進行匹配。
Powerset 的首頁
Powerset 目前面向以下領先的自由內容提供者進行搜索:
- Powerset 對 wikipedia 英文版的250萬篇文章進行搜索
- 針對很多問題,Powerset 從開放的共享知識庫 Freebase 獲得答案。
Powerset 的搜索結果頁包含以下實用功能:
Factz – 當用戶輸入一個搜索主題,Powerset 會從 wikipedia 中總結出一些相關資料。
Dossiers – Powerset 會根據 Freebase 和 Wikipedia 作一個總結,以便用戶對某個主題的概況有一個快速的了解。
Answers – 對很多問題,Powerset 自動根據 wikipedia 和 freebase 中的資料,生成一個答案表。
Semantic Highlighting – 與用戶問題語意相關的搜索結果會加亮顯示。
Minibrowser – 搜索結果會以大綱形式顯示。
Article Outline – 一個導航工具條會隨時漂浮在旁邊幫助用戶快速進入文章的某個章節。
Summary of Factz – 會自動生成文章的內容總結。
Explore Factz – 可以生成相關主題文章的鏈接。
Powerset 常見問題:
為什么 Powerset 的搜索只限于 Wikipedia?
Wikipedia 是網絡上千千萬萬用戶查找高質量信息的源泉,通過對 Wikipedia 的搜索,Powerset 不僅提高了搜索質量,還提供了一種對知識進行總結歸納的新方法。當然,Wikipedia 只是開始,接下來,Powerset 還會將觸角伸向更多資源。
什么是 Freebase?
一個由 Metaweb 提供的自由開發的世界知識庫,Powerset 的一些問題的答案來自 Freebase。
“Powerset”是什么意思?
太文字游戲了 - 譯者。
本文國際來源:http://altsearchengines.com/2008/05/11/powerset-launches-into-the-search-space/ 中文翻譯來源:COMSHARP CMS 官方網站
|