协作推荐

Posted: August 21st, 2009 | Author: laomi | Filed under: 推荐系统 | Tags: , , | No Comments »

前面的文章介绍了基于内容的推荐方法,它使用的是用户的过去的浏览记录来给用户做推荐,而协作推荐它是使用与用户喜好相似的用户们的喜好推荐给此用户,所以协作推荐系统它所看到的推荐项实质上是与他有相似喜好用户的浏览记录。例如一个电影评价网站中,系统会根据你在系统中的浏览记录,在系统中找出与你喜好相似的用户群,然后再将他们的喜好推荐给你。

协作推荐的效用函数的表达:项目s对于用户c的效用函数值主要取决于与用户有相似用户效用函数的值。例如:在电影推荐系统中,你所得到推荐项是那些和你有相同喜好的用户们的最喜欢的电影。根据协作过滤的算法,一般将协作过滤的方法分为两类:启发式的协作过滤和基于模型的协作过滤。

启发式协作过滤主要是根据所有用户以前评价过的项目记录来进行评价预测(就是计算效用函数的值,或者是说来运用说有的用户的评价项目来进行推荐),根据前面的知道我们知道,启发式的方法主要是凭借经验来计算效用函数。启发式的协作过滤对于用户c来说他对项目s的评价值 Read the rest of this entry »


基于内容的推荐

Posted: August 20th, 2009 | Author: laomi | Filed under: 推荐系统 | Tags: , , , | No Comments »

基于内容的信息推荐方法的理论依据主要来自于信息检索信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来想用户推荐用户没有接触过的推荐项。下面主要是从两个方面来说基于内容的推荐方法:启发式的方法和基于模型的方法。

启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断的是修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项的中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。 Read the rest of this entry »


推荐系统

Posted: August 17th, 2009 | Author: laomi | Filed under: 推荐系统 | Tags: | No Comments »

自从上个世纪90年代的一篇关于协作过滤的论文发表以后,推荐系统就成为了一个重要的研究领域了。那么什么是推荐系统呢?就是根据用户的喜好和习惯,把一些用户没有浏览过的信息呈现给用户。目前在学术界和工业界已经有了不少的信息推荐系统了,比如:亚马逊的产品推荐系统(推荐书籍和cd等)。在国内见过的最多就是校内的好友推荐和豆瓣的书籍推荐等。

如果对推荐系统进行追根溯源的话,推荐系统涉及到认知学、信息检索、预报科学和管理科学等等。推荐系统从20世纪90年代独立出来,成为一个独立的研究领域,起主要的研究对象就是估计推荐对象的等级。通常来说,推荐系统常常可以以如下的形式表达:C是所有用户的集合,S是所有有可能被推荐项目的集合(就是有可能推荐对象的集合),U是效用函数—就是对于某一个用户c来说s的有用程度。在推荐系统中,常常推荐给系统用户的是效用函数值最高的项目或者是最好的几个项目(item,也就是推荐对象)。 Read the rest of this entry »


向量空间模型

Posted: July 31st, 2009 | Author: laomi | Filed under: 信息检索 | Tags: , , | No Comments »

我们已经知道了词条权重怎么去计算,词条权重的计算也是为后面信息检索或者是做推荐系统的推荐来做服务,将评分最高的数据显示在最前面或者是推荐给系统的使用者(对推荐系统来说的)。而向量空间模型(vector space model)就是其中的一种很普遍的计算scoring的一中方法。

对于信息检索的系统来说,向量空间模型主要是将查询的词条与索引的数据进行计算,一般直接的表现方式是计算向量之间的余弦值。我们知道只有当两个向量的余弦值为1的时候,那么他们之间的夹角是为0的,这种情况下我们就认为这与查询的结果最近似。在搜索引擎中,通过这样的计算查询条件的此条与被被查询的文档之间的词条的得分来对搜索结果进行排序。

对于推荐系统来说,推荐系统的一个很主要的特征就是根据用户的历史记录或者是描述用户的特征数据来向用户推荐信息。比如在一个购书网站例如china-pub,系统可以根据你在网站中的访问记录来给你推荐你可能感兴趣的书籍。对于一个社交网来说,可能依据是你的好友信息来推荐信息给你,对于这样的推荐形式大概可以分为:通过分析你的个人的浏览记录和个人的喜好来推荐信息给用户,另外一种方式是通过好友的信息来做推荐。 Read the rest of this entry »


最近状况

Posted: July 22nd, 2009 | Author: laomi | Filed under: 心情日志 | Tags: , | No Comments »

说起来自己还真的是有点不敢相信,最近一直没怎么联系的人都联系起来了,有些人甚至有5年多没有联系了。最近的心态不是很好,因为自己一直在做自己不喜欢做的事情,最主要的是看不到将来自己要走的路。
在实验室,自己真的是什么都弄过一些,什么都了解一点,但是自己一直没有固定的方向一直走下来。一个是自己一直处于迷茫的状态,另一个是……自己一直以为自己适合做工程项目,所以在实验室这边自己也一直想做SOA相关的项目,但是由于某种原因自己的方向改为了信息检索,一开始的时候还真的是不知道自己要干什 Read the rest of this entry »