Posts Tagged ‘相似度计算’

协作推荐

Posted in 推荐系统 on August 21st, 2009 by laomi – Be the first to comment

前面的文章介绍了基于内容的推荐方法,它使用的是用户的过去的浏览记录来给用户做推荐,而协作推荐它是使用与用户喜好相似的用户们的喜好推荐给此用户,所以协作推荐系统它所看到的推荐项实质上是与他有相似喜好用户的浏览记录。例如一个电影评价网站中,系统会根据你在系统中的浏览记录,在系统中找出与你喜好相似的用户群,然后再将他们的喜好推荐给你。

协作推荐的效用函数的表达:项目s对于用户c的效用函数值主要取决于与用户有相似用户效用函数的值。例如:在电影推荐系统中,你所得到推荐项是那些和你有相同喜好的用户们的最喜欢的电影。根据协作过滤的算法,一般将协作过滤的方法分为两类:启发式的协作过滤和基于模型的协作过滤。

启发式协作过滤主要是根据所有用户以前评价过的项目记录来进行评价预测(就是计算效用函数的值,或者是说来运用说有的用户的评价项目来进行推荐),根据前面的知道我们知道,启发式的方法主要是凭借经验来计算效用函数。启发式的协作过滤对于用户c来说他对项目s的评价值 read more »

基于内容的推荐

Posted in 推荐系统 on August 20th, 2009 by laomi – Be the first to comment

基于内容的信息推荐方法的理论依据主要来自于信息检索信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来想用户推荐用户没有接触过的推荐项。下面主要是从两个方面来说基于内容的推荐方法:启发式的方法和基于模型的方法。

启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断的是修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项的中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。 read more »

向量空间模型

Posted in 信息检索 on July 31st, 2009 by laomi – Be the first to comment

我们已经知道了词条权重怎么去计算,词条权重的计算也是为后面信息检索或者是做推荐系统的推荐来做服务,将评分最高的数据显示在最前面或者是推荐给系统的使用者(对推荐系统来说的)。而向量空间模型(vector space model)就是其中的一种很普遍的计算scoring的一中方法。

对于信息检索的系统来说,向量空间模型主要是将查询的词条与索引的数据进行计算,一般直接的表现方式是计算向量之间的余弦值。我们知道只有当两个向量的余弦值为1的时候,那么他们之间的夹角是为0的,这种情况下我们就认为这与查询的结果最近似。在搜索引擎中,通过这样的计算查询条件的此条与被被查询的文档之间的词条的得分来对搜索结果进行排序。

对于推荐系统来说,推荐系统的一个很主要的特征就是根据用户的历史记录或者是描述用户的特征数据来向用户推荐信息。比如在一个购书网站例如china-pub,系统可以根据你在网站中的访问记录来给你推荐你可能感兴趣的书籍。对于一个社交网来说,可能依据是你的好友信息来推荐信息给你,对于这样的推荐形式大概可以分为:通过分析你的个人的浏览记录和个人的喜好来推荐信息给用户,另外一种方式是通过好友的信息来做推荐。 read more »