语义搜索引擎—Swoogle
Posted: July 18th, 2009 | Author: laomi | Filed under: 语义搜索 | Tags: 信息检索, 语义搜索, semantic search | No Comments » 随着语义web的提出和owl成为w3c的规范,人们根据自己的领域需求和对事物的理解,构建了很多本体。随着本体数量的增加,如何共享这些本体也已经成为了一个问题,随之便产生了Swoogle这样的对语义web文档检索的搜索引擎。Swoogle主要有三个主要功能:搜索本体,主要是为减少在不知道有相关的本体条件下随意的创建本体,起到一个本体复用的作用,它主要是检索在文档中 的任何地方的术语(包括在注释中的术语),或者是本体汇总的类和属性的术语以及本体是要查找的术语;发掘实例数据,主要是工作查询什么类和什么属性来查询 实例(关于这一点还是有点迷糊);描述语义web的特征(characterizing the semantic web),通过对语义文档的元数据和对文档内部关系的收集。
Swoogle从目前接触的情况来看,它之所以叫做语义搜索引擎其主要原因是因为它检索的目标是语义文档吧。它所用的技术基本上都是传统的搜索引擎所用到 的技术没有什么区别,在创建索引方面就直接使用目前的倒排索引的方式来创建索引。在做索引的时候没有用到对检索内容的推理和本体匹配的技术等等,也没有用 到。swoogel的ranking和google的pagerank原理基本上都是一样的,google的pagerank是根据网页文档当中的超连接 来进行分析,而swoogle的ranking是根据语义文档中的引用和扩展其他的本体中的概念和关系,从分析的实质上讲没有什么差别。在计算方面也比较 简单也是直接按照pagerank的算法公式差不多:
- Li Ding, Tim Finin, Anupam Joshi, Rong Pan, R. Scott Cost, Yun Peng, Pavan Reddivari, Vishal C Doshi, and Joel Sachs Proceedings of the Thirteenth ACM Conference on Information and Knowledge Management November 09, 2004
- Introduction to Information Retrieval. C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2008. Classical and web information retrieval systems: algorithms, mathematical foundations and practical issues.
- L Ding, R Pan, T Finin, A Joshi, Y Peng, P Kolari – The Semantic Web-ISWC 2005: 4th International Semantic Web Finding and Ranking Knowledge on the Semantic Web Li Ding, Rong Pan, Tim Finin, Anupam Joshi, Yun Peng, and Pranam Kolari
当初阅读这方面的知识是想做语义搜索引擎的相关内容,但是这篇文章于自己所需要做到语义搜索引擎可能会有所差别,因为Swoogle它针对的是通用的语义 搜索,而且它的搜索结果就是语义web文档。有时候在想,语义搜索真的要死扣语义web文档?在实际的做法中我还是更倾向于用本体来做数据模型,去描述数 据之间的关系和数据模型共享。
Leave a Reply