Posts Tagged ‘信息检索,体会’

语义搜索引擎–yebol

Posted in 江湖消息, 语义搜索 on August 6th, 2009 by laomi – Be the first to comment

关于语义搜索引擎自己总是觉得很虚,每次在网上看到很多关于语义的搜索引擎的介绍。最近有一个又有一篇关于语义搜索引擎的报道,目前只要是看到这种的文章或者是报道,总感觉是在炒作,没人真正的去做语义搜索。

最近又被炒作的语义搜索的叫做yebol的搜索引擎,进入它的首页之后您可以看到”Knowledge Based (Semantic) Search”,但是现在进入系统之后发现已经被改掉了,改为”Knowledge Based (Smart) Search”(可以看到他的about页面还没有改过来)。因为自己这边老板一直吵着要做语义搜索引擎,一般对于关于声称自己是“(基于)语义的搜索”是非常关注的。yebol在介绍自己的时候既然连钱学森都扯到了,无语,目前这个基于知识的搜索引擎(这种说法我承认)采取显示搜索结果的方式还是有些不一样的,他所作的工作就是将搜索结果以分类的形式展现出来。比如在yebol中搜索“Bill Gates”,在返回界面中主要分为几种形式:Relate topic,Top Sites,Categories,Expanded Searches,Images,Vedioes,News,twitter和Search Result等。这种形式的搜索结果的显示方式,从一定的程度上说它组织了信息的显示形式,如果按照yebol中介绍的信息合和知识的主要区别在于:信息是静态的、未结构化的、以数据为中心的,而对于知识来说就是结构化的、按照语义做排序的以人为中心的。从目前的yehol的搜索结果的显示形式和定义来看,yehol它确实可以称之为“基于知识的搜索引擎”。看完它的介绍之后,总后自己还是有点失望,没有说到任何关于语义搜索的意思。 read more »

学习记录的开始

Posted in 开发日志 on June 18th, 2009 by laomi – 1 Comment

其实自己一直想弄一个blog来记录一下自己的学习,一是为了督促自己好好学习知识,另一方面是希望得到网上的朋友们的指导。

在实验室,目前自己的方向主要是定位是信息检索,而自己的定位主要是在相似度计算方面。目前打算读的比较系统资料有:

  1. Introduction to Information Retrieval. C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2008. Classical and web information retrieval systems: algorithms, mathematical foundations and practical issues.
  2. Managing Gigabytes. I.H. Witten, A. Moffat, T.C. Bell. Morgan Kaufmann, 1999. The authority on index construction and compression.

在论文方面目前也主要是分两部分来读,一部分是一些基础部分,这部分主要是针对一些综述性论文,还有就是一些比较经典型的论文,比如pagerank,hits等。再结合自己的工作,然后针对的去读一些论文吧,目前自己论文工作正在整理中(还得和老板好好的商量)。

今后在blog上主要内容还是搜索相关的信息和自己的学习体会,然后会对自己读的书或者是论文写一些总结性的文章。希望大家批评指导。