推荐系统(2)

在前面的推荐系统文章中主要是介绍了推荐系统的一些基本含义以及他涉及到那些学科,这篇文章主要是从推荐系统定义以及研究问题上说说自己所了解到的推荐系统,有不对或者不足之处还希望大牛们给以指正。

推荐系统其主要是为了给用户从大规模数据中(也就是大家常常说的信息过载问题)找出用户想要的数据,它单独成为一门学科还是从上个世纪关于一篇用协作过滤的方法题出来的,但是对于推荐系统的定义主要经历了三个主要发展:

Resnick & Varian (1997)中定义:推荐系统就是一个集合一个群体中用户对于项目的信息,然后用这些信息去指导这个群体中其他人对这些推荐项的兴趣的系统。

Herlocker(2000)定义:推荐系统就是一个能够预测用户将来感兴趣或者用价值的推荐相的系统。

Burker(2003)定义:推荐系统它是一个能够将[1]产生个人推荐作为输出或者是[2]能够在用户从大规模的可选择的数据中,能够指导用户以个性化方式去选择感兴趣或者是用户的对象的系统。从定义上看,只要是满足满足条件[1]或者是条件[2]2我们都可以称之为推荐系统。

在推荐系统中,有一个很重要的因素是关于一个项目对于一个用户来说他的喜欢程度或者是有用程度的表达。我们直到对于一个事物的表达从我们的个人感觉去刻画的,它是比较抽象的,例如:你喜欢吃香蕉,但是你到底有多喜欢?一般是很难定量的去描述,只能去定性的角度去描述,往往我们常常说的是,我很喜欢吃香蕉或者是说,相对于苹果,我更喜欢吃香蕉。但是,对于计算机来说,喜欢就是喜欢,不喜欢就是不喜欢,它没有感情(起码现在的计算机基本上都是这样的吧),所以它需要一个确定的数值去描述他。在推荐系统中,常常用一个范围的值去刻画某个推荐项对用户的兴趣或者是作用,例如:在一个食物推荐系统中,可以用1表示喜欢,0表示不喜欢,或者是在一个电影评价系统中,常常会用几个值来描述用户对电影的兴趣。

推荐系统的结果往往有两种形式:一种形式是预测,另外一种形式是将相关的推荐项列举出来。首先说说的一种形式,预测总体来说它是一个值,它表示的是该用户对某个推荐项的兴趣程度。例如在电影推荐系统,对于某一用户来说,系统预测出《建国大业》值为4(表示该用户可能很喜欢这个电影);另外一种推荐结果就是从预测值(这里的预测值可以是相对的值)中选择k个最高的推荐项作为推荐结果,或者是设置一个阈值,以超过这个阈值的推荐项作为最后的推荐结果。

作为推荐系统来说,其主要的推荐方法有三种,分别是基于内容的推荐、协作推荐和混合式推荐。相关的具体知识分别看:基于内容推荐协作推荐。混合式推荐方法就是将前面两种方法结合起来。

对于推荐系统来说,其主要的问题有:code-start问题、推荐评价和关于个人数据隐私问题。对于code-start问题的主要原因是由新用户问题和信推荐项问题引起的。任何一个系统都是出现同一个问题那就是怎么去评价系统的优劣,信息检索系统可以通过召回率和准确率来评价,那在推荐西系统中我们怎么去评价系统的优劣呢?至于数据隐私问题,因为推荐系统它是为了迎合用户的需求,那它必然直接或者间接的用到关于用户的兴趣的隐私性数据问题。

对于之前自己一直认为推荐系统的信息模式只有一种,通过阅读资料自己发现自己的理解的缺陷,其实推荐系统信息模式可以有推模式和拉模式两种形式,按照第三种定义,只要是对用户的兴趣选择有帮助的,都是推荐系统。

主要参考论文:Supporting People In Finding Information: Hybrid Recommender Systems and Goal-Based Structuring

Share and Enjoy:
  • Sphinn
  • Facebook
  • Mixx
  • Google Bookmarks
  • Twitter
  • Yahoo! Bookmarks
  • 校内

One Comment

  1. daimy says:

    http://daimy.blog.com/

    you konw. knock round without duly updating. sorry.

Leave a Reply