Powerset vs Cognition: 语义搜索对决
作者: its
|
发布: 2008/6/8 (20:19)
|
阅读: 49429
|
评论: 1
|
静态地址
|
内容源码
语义搜索引擎 Powerset 以对 Wikipedia 进行搜索,并在搜索结果中包含语义相关内容展示著称,Cognition Technologies 是另一种语义搜索技术,本文通过一些搜索示例,对二者的语义搜索技术以及 Google 搜索进行对比。
示例 1: Powerset
Powerset 可以在某些搜索形式中大放异彩,比如,对一些需要从数据集中对内容进行抽象与聚合的搜索,下面的搜索示例中,Powerset 对用户寻找的信息进行了非常出色的总结并以很漂亮的形式进行展示。
“military intelligence”
“teams in the NFL”
示例 2: Cognition Technologies
另一方面,有另一种形式的搜索,牵扯到对语义的剖析,这种搜索会让 Powerset 感到疑惑,Cognition 却能得到更好的结果。
“rare wildlife of the Amazon”
“football players who went to jail”
示例 3: Google
有一些搜索(尤其是不牵扯语义剖析的场合),Google 的结果远远好过 Powerset 与 Cognition:
“helicopter carrier Iwo Jima class”
以上的搜索,Google 返回了最佳结果,Powerset 返回了相关结果,Cognition 则彻底糊涂了。
消除歧义
搜索领域的一个难题是语言的歧义,在这方面,Powerset 和 Cognition 胜过 Google,比如,当用户输入 Java 这个搜索词,他真实的意思是什么?是那个 Java 岛,还是 Java 编程语言,还是指咖啡? Google 最近在这方面做了一些试验,但 Powserset 和 Cognition 做得更好。
当 Powerset 发现歧义,会使用 Tab 对结果进行区分:
Cognition 处理方式不同,会允许用户从不同的语义中选择:
对用户的影响
对绝大多数普通搜索,Google 做得已经够好,我们已经习惯基于关键词的搜索,在这种搜索模式下,Google 庞大的资源,广泛的索引,基于 PageRank 算法的获得恰当结果的强大威力,让别的搜索引擎根本没有办法超越,用户在一些特别搜索情形可能需要一些努力,但绝大多数用户会接受。事实上,Google 已经成了搜索的代名词,就象 Xerox 代表复印一样。
未来的竞争
既然这样,Powerset (以及 Cognition)将如何吸引用户?
Clayton Christensen 与 Michael Raynor 在他们的新书《The Innovator’s Solution》中,谈到创新公司如何挑战市场领先者与既有的消费习惯并获得成功。他们认为注定会失败的一个方法是这些小公司企图超过那些市场巨头。相反,他们建议使用以下两种方法进入区分市场。
- 新市场策略:吸引那些新用户并为他们培育整体市场。
- 低端策略:有一些用户对价格比较敏感,愿意牺牲一些功能换取低价。
换句话说,这些新公司必须从那些市场巨头的夹缝中发现商机,因此,同 Google 正面交锋将毫无希望,Google 会不惜一切代价反击,同时,因为 Google 是免费的,所以上面说的低端时常策略也没用。
新市场策略如何?任何上网的用户都已经在用某种搜索引擎(而 Google 占绝对优势),然而,Google 一直以来都遵循着一些原则:简单的用户界面,飞快的响应速度,以及结果的恰当程度,对这些原则进行分析,我们可以从中发现一些新的用例,比如:
-
-
响应速度:对于一些高级搜索,用户可能并不在乎等待。试想有一个搜索服务机构,用户提出复杂的查询要求,这个搜索服务机构第二天向你提供完善的搜索结果,比如,你计划做一次旅行,需要机票,酒店以及租车服务,你需要最低的费用,这些查询适合刚才说的类型。
-
结果的恰当程度:虽然所有搜索引擎使用类似的标准保证恰当的结果(主要基于内容被链接的质量),有一些算法对某些类型的查询肯定更好,社会媒体的相关程度是一个明显的例子,著名内容加权也是一个例子。
本文国际来源:http://gigaom.com/2008/06/07/powerset-vs-cognition-a-semantic-search-shoot-out/ 中文翻译来源:COMSHARP CMS 官方网站
|