<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
	xmlns:media="http://search.yahoo.com/mrss/"
>

<channel>
	<title>Just learning and thinking &#187; 推荐系统</title>
	<atom:link href="http://www.rushcj.com/laomi/archives/category/%e6%8e%a8%e8%8d%90%e7%b3%bb%e7%bb%9f/feed" rel="self" type="application/rss+xml" />
	<link>http://www.rushcj.com/laomi</link>
	<description></description>
	<lastBuildDate>Tue, 01 Nov 2011 15:57:18 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<!-- podcast_generator="podPress/8.8" - maintenance_release="8.8.4" -->
		<copyright>Copyright &#xA9; 2012 Just learning and thinking </copyright>
		<managingEditor>laomi4569@gmail.com ()</managingEditor>
		<webMaster>laomi4569@gmail.com ()</webMaster>
		<category>posts</category>
		<itunes:keywords></itunes:keywords>
		<itunes:subtitle></itunes:subtitle>
		<itunes:summary>Just learning and thinking</itunes:summary>
		<itunes:author></itunes:author>
		<itunes:category text="Society &amp; Culture"/>
		<itunes:owner>
			<itunes:name></itunes:name>
			<itunes:email>laomi4569@gmail.com</itunes:email>
		</itunes:owner>
		<itunes:block>No</itunes:block>
		<itunes:explicit>no</itunes:explicit>
		<itunes:image href="http://www.rushcj.com/laomi/wp-content/plugins/podpress/images/powered_by_podpress_large.jpg" />
		<image>
			<url>http://www.rushcj.com/laomi/wp-content/plugins/podpress/images/powered_by_podpress.jpg</url>
			<title>Just learning and thinking</title>
			<link>http://www.rushcj.com/laomi</link>
			<width>144</width>
			<height>144</height>
		</image>
		<item>
		<title>推荐系统(2)</title>
		<link>http://www.rushcj.com/laomi/archives/162</link>
		<comments>http://www.rushcj.com/laomi/archives/162#comments</comments>
		<pubDate>Tue, 29 Sep 2009 11:16:57 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[基于内容推荐]]></category>
		<category><![CDATA[协作推荐]]></category>
		<category><![CDATA[混合推荐]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=162</guid>
		<description><![CDATA[在前面的推荐系统文章中主要是介绍了推荐系统的一些基本含义以及他涉及到那些学科，这篇文章主要是从推荐系统定义以及研究问题上说说自己所了解到的推荐系统，有不对或者不足之处还希望大牛们给以指正。 推荐系统其主要是为了给用户从大规模数据中（也就是大家常常说的信息过载问题）找出用户想要的数据，它单独成为一门学科还是从上个世纪关于一篇用协作过滤的方法题出来的，但是对于推荐系统的定义主要经历了三个主要发展： Resnick &#38; Varian (1997)中定义：推荐系统就是一个集合一个群体中用户对于项目的信息，然后用这些信息去指导这个群体中其他人对这些推荐项的兴趣的系统。 Herlocker（2000）定义：推荐系统就是一个能够预测用户将来感兴趣或者用价值的推荐相的系统。 Burker(2003)定义：推荐系统它是一个能够将［1］产生个人推荐作为输出或者是［2］能够在用户从大规模的可选择的数据中，能够指导用户以个性化方式去选择感兴趣或者是用户的对象的系统。从定义上看，只要是满足满足条件［1］或者是条件［2］2我们都可以称之为推荐系统。 在推荐系统中，有一个很重要的因素是关于一个项目对于一个用户来说他的喜欢程度或者是有用程度的表达。我们直到对于一个事物的表达从我们的个人感觉去刻画的，它是比较抽象的，例如：你喜欢吃香蕉，但是你到底有多喜欢？一般是很难定量的去描述，只能去定性的角度去描述，往往我们常常说的是，我很喜欢吃香蕉或者是说，相对于苹果，我更喜欢吃香蕉。但是，对于计算机来说，喜欢就是喜欢，不喜欢就是不喜欢，它没有感情(起码现在的计算机基本上都是这样的吧)，所以它需要一个确定的数值去描述他。在推荐系统中，常常用一个范围的值去刻画某个推荐项对用户的兴趣或者是作用，例如：在一个食物推荐系统中，可以用1表示喜欢，0表示不喜欢，或者是在一个电影评价系统中，常常会用几个值来描述用户对电影的兴趣。 推荐系统的结果往往有两种形式：一种形式是预测，另外一种形式是将相关的推荐项列举出来。首先说说的一种形式，预测总体来说它是一个值，它表示的是该用户对某个推荐项的兴趣程度。例如在电影推荐系统，对于某一用户来说，系统预测出《建国大业》值为4（表示该用户可能很喜欢这个电影）；另外一种推荐结果就是从预测值（这里的预测值可以是相对的值）中选择k个最高的推荐项作为推荐结果，或者是设置一个阈值，以超过这个阈值的推荐项作为最后的推荐结果。 作为推荐系统来说，其主要的推荐方法有三种，分别是基于内容的推荐、协作推荐和混合式推荐。相关的具体知识分别看：基于内容推荐、协作推荐。混合式推荐方法就是将前面两种方法结合起来。 对于推荐系统来说，其主要的问题有：code-start问题、推荐评价和关于个人数据隐私问题。对于code-start问题的主要原因是由新用户问题和信推荐项问题引起的。任何一个系统都是出现同一个问题那就是怎么去评价系统的优劣，信息检索系统可以通过召回率和准确率来评价，那在推荐西系统中我们怎么去评价系统的优劣呢？至于数据隐私问题，因为推荐系统它是为了迎合用户的需求，那它必然直接或者间接的用到关于用户的兴趣的隐私性数据问题。 对于之前自己一直认为推荐系统的信息模式只有一种，通过阅读资料自己发现自己的理解的缺陷，其实推荐系统信息模式可以有推模式和拉模式两种形式，按照第三种定义，只要是对用户的兴趣选择有帮助的，都是推荐系统。 主要参考论文：Supporting People In Finding Information: Hybrid Recommender Systems and Goal-Based Structuring]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/162/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>协作推荐</title>
		<link>http://www.rushcj.com/laomi/archives/114</link>
		<comments>http://www.rushcj.com/laomi/archives/114#comments</comments>
		<pubDate>Fri, 21 Aug 2009 07:57:49 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[协作推荐]]></category>
		<category><![CDATA[相似度计算]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=114</guid>
		<description><![CDATA[前面的文章介绍了基于内容的推荐方法，它使用的是用户的过去的浏览记录来给用户做推荐，而协作推荐它是使用与用户喜好相似的用户们的喜好推荐给此用户，所以协作推荐系统它所看到的推荐项实质上是与他有相似喜好用户的浏览记录。例如一个电影评价网站中，系统会根据你在系统中的浏览记录，在系统中找出与你喜好相似的用户群，然后再将他们的喜好推荐给你。 协作推荐的效用函数的表达：项目s对于用户c的效用函数值主要取决于与用户有相似用户效用函数的值。例如：在电影推荐系统中，你所得到推荐项是那些和你有相同喜好的用户们的最喜欢的电影。根据协作过滤的算法，一般将协作过滤的方法分为两类：启发式的协作过滤和基于模型的协作过滤。 启发式协作过滤主要是根据所有用户以前评价过的项目记录来进行评价预测（就是计算效用函数的值，或者是说来运用说有的用户的评价项目来进行推荐），根据前面的知道我们知道，启发式的方法主要是凭借经验来计算效用函数。启发式的协作过滤对于用户c来说他对项目s的评价值(效用函数的值)就是其他的用户对项目s的评价值的聚合，运用公式的表达形式如下： [pmath size=14]{r_{c,s} = aggrr_{c,s prime }}under{c prime notin hat{C}} ~~~delim{[}{1}{]}[/pmath] 在表达式[1]中[pmath size=8];hat{C}[/pmath]表示的是对项目s已经评价过的所有与用户c相似的用户的集合。一些关于集合函数如下： [pmath size=10]r_{c,s}= 1/N sum{c prime notin hat{C}}{}{r_{c,s prime }} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(a)[/pmath] [pmath size=10] r_{c,s}= k sum{c prime notin hat{C}}{}{sim(c,c prime) r_{c,s prime }}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(b) [/pmath] [pmath size=10]r_{c,s}= overline{r_{c}} + k sum{c prime notin hat{C}}{}{sim(c,c prime) * (r_{c,s prime} &#8211; overline{r_{c}})}~~~~~~~~~~~~~~(c)[/pmath] 在公式(b)和(c)中k充当的是一个归一化参数，k的取值常常是：[pmath size=8] [...]]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/114/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>基于内容的推荐</title>
		<link>http://www.rushcj.com/laomi/archives/83</link>
		<comments>http://www.rushcj.com/laomi/archives/83#comments</comments>
		<pubDate>Thu, 20 Aug 2009 09:29:32 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[相似度计算]]></category>
		<category><![CDATA[tf-idf]]></category>
		<category><![CDATA[权重]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=83</guid>
		<description><![CDATA[基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤，所谓的基于内容的推荐方法就是根据用户过去的浏览记录来想用户推荐用户没有接触过的推荐项。下面主要是从两个方面来说基于内容的推荐方法：启发式的方法和基于模型的方法。 启发式的方法就是用户凭借经验来定义相关的计算公式，然后再根据公式的计算结果和实际的结果进行验证，然后再不断的是修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集，然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算，跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征，并使用这些关键字作为描述用户特征的向量；然后再根据被推荐项的中的权重高的关键字来作为推荐项的属性特征，然后再将这个两个向量最相近的（与用户特征的向量计算得分最高）的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时，一般使用的是cosine方法，计算两个向量之间夹角的cosine值。 对于基于模型的方法来推荐时，常常是使用纯贝叶斯分类的方法来实现，其主要思想就是首先对用户的过去访问记录进行分类，找出用户比较喜欢的分类，然后再将被推荐项进行分类，将与用户比较喜欢的分类的推荐项推荐给用户。对于网页Pj个网页中的关键字[pmath size=10]&#60;m&#62;k_{1,j} cdots k_{n,j}&#60;/m&#62;[/pmath]计算这个网页属于列别Ci，根据纯贝叶斯分类计算则有： [pmath size=10]&#60;m&#62;P(C_{i} delim{&#124;} k_{1,j}  cdots  &#38;k_{n,j})~~~~delim{[}{1}{]}&#60;/m&#62;[/pmath]再假设这些关键字是独立的且这些关键字在文档或者是句子中的位置也是独立的，从而可以将公式[1]化简成[pmath size=10]&#60;m&#62;P(C_{i})prod{x}{}{P(k_{x, j}delim{&#124;}C_{i}})~~~~delim{[}{2}{]}&#60;/m&#62;[/pmath]，然后再根据用户过去的访问记录计算出[pmath]&#60;m&#62;P(C_{i})&#60;/m&#62;[/pmath]和[pmath]&#60;m&#62;P(k_{x,j})delim{&#124;} C_{i})&#60;/m&#62;[/pmath]值。 基于内容的推荐能很好的根据用户的过去的访问记录来给用户做推荐，但是基于内容的推荐还是存在局限性的： 内容分析的限制。这些限制主要来来自于信息检索技术，例如如何从数据中抽取去特征数据，因为特征抽取在信息检索中就是一个问题。 过于专门化。仅仅是推荐与用户以前喜欢的推荐项，因为基于内容的推荐方法就是根据用户过去的访问记录来给用户做推荐。 新用户问题。这个也是基于内容的推荐性质决定的，一个用户一上来是没有任何记录的，所以很难推荐项目给用户。 基于内容的推荐方法用到知识很多都是信息检索用的方法，例如tf-idf和文本分类技术等，基于内容的推荐方法其实质就是根据用户的访问记录来得出用户的特征属性，然后再根据用户的特征属性与推荐项的特征属性来计算效用函数的值，并将结果推荐给用户。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/83/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>推荐系统</title>
		<link>http://www.rushcj.com/laomi/archives/81</link>
		<comments>http://www.rushcj.com/laomi/archives/81#comments</comments>
		<pubDate>Mon, 17 Aug 2009 13:54:50 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[推荐系统]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=81</guid>
		<description><![CDATA[自从上个世纪90年代的一篇关于协作过滤的论文发表以后，推荐系统就成为了一个重要的研究领域了。那么什么是推荐系统呢？就是根据用户的喜好和习惯，把一些用户没有浏览过的信息呈现给用户。目前在学术界和工业界已经有了不少的信息推荐系统了，比如：亚马逊的产品推荐系统(推荐书籍和cd等)。在国内见过的最多就是校内的好友推荐和豆瓣的书籍推荐等。 如果对推荐系统进行追根溯源的话，推荐系统涉及到认知学、信息检索、预报科学和管理科学等等。推荐系统从20世纪90年代独立出来，成为一个独立的研究领域，起主要的研究对象就是估计推荐对象的等级。通常来说，推荐系统常常可以以如下的形式表达：C是所有用户的集合，S是所有有可能被推荐项目的集合(就是有可能推荐对象的集合)，U是效用函数&#8212;就是对于某一个用户c来说s的有用程度。在推荐系统中，常常推荐给系统用户的是效用函数值最高的项目或者是最好的几个项目(item,也就是推荐对象)。 在信息推荐系统中，主要是根据用户的资料和被推荐对象的轮廓信息(profile)来做推荐的。对于用户来说，其主要信息就是用户的年龄、兴趣爱好已经用户浏览数据的轮廓信息等，对于推荐对象的轮廓信息其主要是描述这个对象特征信息，例如电影：电影名称、发行时间、导演、主要演员和电影类型等等，这一系列描述推荐对象的特征数据就叫做推荐对象(在推荐系统中，常常将推荐对象记为item)的特征。在实际的推荐系统中不会用到全部的特征信息，一般只是特征信息的子集（只需要描述对象的主要信息的特征信息）。效用函数是根据用户集合C和推荐项集合S来外推，一般来说外推法首先是利用探索式的方法来定义效用函数，然后再凭借经验来验证效用函数的性能，然后根据一些优化性能的方法来评价效用函数。推荐系统根据其等级评估方法大概可以分为三类： 基于内容的推荐方法。这种方法主要是根据用户自己过去的浏览记录来向用户推荐用户没有浏览过的信息。 协作推荐。这种方法主要是根据与当前用户有相同或者是相似的品位或者是爱好的用户历史记录来做推荐，这种推荐首先就是要在用户集合C中找出与当前用户最相似的用户。 混合的方法。这种方法就是结合基于内容的推荐和协作推荐来做推荐。 在后面的推荐系统的介绍文章中，主要是从这三个方法来做分别介绍。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/81/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->
