Posts Tagged ‘semantic search’

语义搜索引擎–yebol

Posted in 江湖消息, 语义搜索 on August 6th, 2009 by laomi – Be the first to comment

关于语义搜索引擎自己总是觉得很虚,每次在网上看到很多关于语义的搜索引擎的介绍。最近有一个又有一篇关于语义搜索引擎的报道,目前只要是看到这种的文章或者是报道,总感觉是在炒作,没人真正的去做语义搜索。

最近又被炒作的语义搜索的叫做yebol的搜索引擎,进入它的首页之后您可以看到”Knowledge Based (Semantic) Search”,但是现在进入系统之后发现已经被改掉了,改为”Knowledge Based (Smart) Search”(可以看到他的about页面还没有改过来)。因为自己这边老板一直吵着要做语义搜索引擎,一般对于关于声称自己是“(基于)语义的搜索”是非常关注的。yebol在介绍自己的时候既然连钱学森都扯到了,无语,目前这个基于知识的搜索引擎(这种说法我承认)采取显示搜索结果的方式还是有些不一样的,他所作的工作就是将搜索结果以分类的形式展现出来。比如在yebol中搜索“Bill Gates”,在返回界面中主要分为几种形式:Relate topic,Top Sites,Categories,Expanded Searches,Images,Vedioes,News,twitter和Search Result等。这种形式的搜索结果的显示方式,从一定的程度上说它组织了信息的显示形式,如果按照yebol中介绍的信息合和知识的主要区别在于:信息是静态的、未结构化的、以数据为中心的,而对于知识来说就是结构化的、按照语义做排序的以人为中心的。从目前的yehol的搜索结果的显示形式和定义来看,yehol它确实可以称之为“基于知识的搜索引擎”。看完它的介绍之后,总后自己还是有点失望,没有说到任何关于语义搜索的意思。 read more »

语义搜索引擎—Swoogle

Posted in 语义搜索 on July 18th, 2009 by laomi – Be the first to comment

        随着语义web的提出和owl成为w3c的规范,人们根据自己的领域需求和对事物的理解,构建了很多本体。随着本体数量的增加,如何共享这些本体也已经成为了一个问题,随之便产生了Swoogle这样的对语义web文档检索的搜索引擎。Swoogle主要有三个主要功能:搜索本体,主要是为减少在不知道有相关的本体条件下随意的创建本体,起到一个本体复用的作用,它主要是检索在文档中 的任何地方的术语(包括在注释中的术语),或者是本体汇总的类和属性的术语以及本体是要查找的术语;发掘实例数据,主要是工作查询什么类和什么属性来查询 实例(关于这一点还是有点迷糊);描述语义web的特征(characterizing the semantic web),通过对语义文档的元数据和对文档内部关系的收集。
         Swoogle从目前接触的情况来看,它之所以叫做语义搜索引擎其主要原因是因为它检索的目标是语义文档吧。它所用的技术基本上都是传统的搜索引擎所用到 的技术没有什么区别,在创建索引方面就直接使用目前的倒排索引的方式来创建索引。在做索引的时候没有用到对检索内容的推理和本体匹配的技术等等,也没有用 到。swoogel的ranking和google的pagerank原理基本上都是一样的,google的pagerank是根据网页文档当中的超连接 来进行分析,而swoogle的ranking是根据语义文档中的引用和扩展其他的本体中的概念和关系,从分析的实质上讲没有什么差别。在计算方面也比较 简单也是直接按照pagerank的算法公式差不多: read more »