<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
	xmlns:media="http://search.yahoo.com/mrss/"
>

<channel>
	<title>Just learning and thinking &#187; 江湖消息</title>
	<atom:link href="http://www.rushcj.com/laomi/archives/category/%e6%b1%9f%e6%b9%96%e6%b6%88%e6%81%af/feed" rel="self" type="application/rss+xml" />
	<link>http://www.rushcj.com/laomi</link>
	<description></description>
	<lastBuildDate>Tue, 01 Nov 2011 15:57:18 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<!-- podcast_generator="podPress/8.8" - maintenance_release="8.8.4" -->
		<copyright>Copyright &#xA9; 2012 Just learning and thinking </copyright>
		<managingEditor>laomi4569@gmail.com ()</managingEditor>
		<webMaster>laomi4569@gmail.com ()</webMaster>
		<category>posts</category>
		<itunes:keywords></itunes:keywords>
		<itunes:subtitle></itunes:subtitle>
		<itunes:summary>Just learning and thinking</itunes:summary>
		<itunes:author></itunes:author>
		<itunes:category text="Society &amp; Culture"/>
		<itunes:owner>
			<itunes:name></itunes:name>
			<itunes:email>laomi4569@gmail.com</itunes:email>
		</itunes:owner>
		<itunes:block>No</itunes:block>
		<itunes:explicit>no</itunes:explicit>
		<itunes:image href="http://www.rushcj.com/laomi/wp-content/plugins/podpress/images/powered_by_podpress_large.jpg" />
		<image>
			<url>http://www.rushcj.com/laomi/wp-content/plugins/podpress/images/powered_by_podpress.jpg</url>
			<title>Just learning and thinking</title>
			<link>http://www.rushcj.com/laomi</link>
			<width>144</width>
			<height>144</height>
		</image>
		<item>
		<title>【转载】一则很老的YYK(yy king)</title>
		<link>http://www.rushcj.com/laomi/archives/257</link>
		<comments>http://www.rushcj.com/laomi/archives/257#comments</comments>
		<pubDate>Tue, 04 Jan 2011 18:05:50 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[笑话]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=257</guid>
		<description><![CDATA[一、考研回忆 以前我天天都想自杀 有一天我在天桥默默走著犹豫要不要直接跳下去的时候 突然眼前一个广告让我眼睛一亮 进入浙大CS　您将拥有全世界 我想姑且试一试　百无赖聊活著不如找件事做 于是我花了一年每天没天没日的念书 直到考研那天　我才发现我袜子已经穿一年没换了 全身都是霉味 终于脱离北大数学系进入浙大CS 考进之后　每天校门口都有一堆美女等著我 说要找我出去玩　我说我要去教九自修 结果美女门就带在教室陪我　我只有中间休息的时间才抱抱她们亲亲她们 现在我人生充满希望　老师跟我说　我在cell nature SCI的期刊得到全世界的赞赏 已经被提名诺贝尔奖 如今　我常常回去走那个天桥　那个在我人生最低潮时看见的广告 我把他买下来了　放著另外的标题 荣耀　尊绝　不凡　浙大 CS 很多乞丐原本想要在天桥上乞讨的现在也纷纷狂肯大学联考 他们的眼神全都变了 每个都是那么锐利　全身充满冲劲 她们现在每天早上六点聚在天桥前　“CS才是王道！！！” 声音那么的宏亮　阳光洒下来　一切的绝望终将过去 二、面店老板 记的六年前  我还在念研究生的时候 有一次出门忘记带皮包~&#8221;~ 我就跟老板说  老板! 打个商量好不好  我真的是忘了带皮包出来 不是故意不付帐的@@&#8221; 老板说  操  你想吃霸王餐吗? ~&#8221;~  我说不是这样子的  我真的是一时忘记带出来.. 就这样跟老板僵持很久&#8230; 眼看老板就要发火揍我了 我刚好摸到口袋里有带学生证出来 不然这样子好吗? 老板  我压我的学生证 在这边  我回去拿钱回来付? 可以吗? 老板抢过我的学生证  说  好! 就信你一次 我就匆匆忙忙跨上我的老坦克直奔31舍 [...]]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/257/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>转载 沁园春*房</title>
		<link>http://www.rushcj.com/laomi/archives/256</link>
		<comments>http://www.rushcj.com/laomi/archives/256#comments</comments>
		<pubDate>Fri, 31 Dec 2010 04:28:36 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[蛋疼]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=256</guid>
		<description><![CDATA[神州大地， 万人蜗居， 亿人盼房。 望北京上海， 高楼大厦， 售楼中心， 房奴滔滔。 祖孙三代， 倾尽所有， 欲与房价试比高。 须钞票， 清储蓄贷款， 分外心焦。 楼价如 此虚高， 逼无数白领竞折腰。 昔秦皇汉武， 闻所未闻； 唐宗宋祖， 紧捏钱包。 一代天骄， 成吉思汗， 只好蜗居蒙古包。 俱往矣， 数天价楼盘， 还看今朝。 转载自：http://cq.people.com.cn/News/2010125/2010125111811.htm]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/256/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>最近听的一些报告</title>
		<link>http://www.rushcj.com/laomi/archives/250</link>
		<comments>http://www.rushcj.com/laomi/archives/250#comments</comments>
		<pubDate>Sat, 20 Nov 2010 03:50:20 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=250</guid>
		<description><![CDATA[最近实验室邀请了一些国内外计算机领域专家来实验室做演讲，自己主要是挺了北京大学网络所的李晓明老师的报告，其他的报告自己基本上没有怎么去听。 李晓明老师的报告的是他们目前的一个论文成果，其将的主要内容是对于信息检索系统的评价问题，以前的信息检索的主要评价方法是准确率和召回率，而这篇文章中是从用户在使用系统的间隔时间这个角度来分析信息检索的返回结果的准确率问题。整个报告给人的感觉很严谨，从问题的提出，就能给人一种直观的印象（感觉他提出的方法可行），然后将想法转换为一个信息检索评价公式，然后再用数学方法证明该方法理论上的可行性问题，最后是实验，主要是从准确率和用户体验两个角度来验证自己的假设。整个报告给我感觉不仅仅是思路、思维上的严谨，最主要的是如何去思考问题，现实中的问题是永远是很复杂的，计算机也不够聪明能去理解使用者的意图。在做科学研究中如何将现实生活中的复杂模型简化了一个理想的科学问题模型，将会是做研究的一个很重要的技巧，特别是对于分析应急领域的研究来说，特别重要。在研究不一定将要自己的研究成果马上转化为生产力，也不一定要满足现实生活中遇到的所有的条件，只需要满足一部分或者是一类问题即可，最关键的是给一类问题提出一种可解决的办法或者是方案。李晓明老师的报告中充分的体现出了这一点，我想他在与我们的交流中，我们提出的问题也一定能够成为他们今后研究或者是攻克的主要课题。 在与交流的过程中，大家提出很多类似于实验室科研成果产品化的问题。其实当初他们实验室的天网下载软件做的还不错，但是他们之后也有不少的下载软件也得到了不少的成功。网下载软件当时给我印象就是不干净的东西太多了，在一定的时间内能够很好的推广，但是一旦用户群大起来之后，如果得不到很好的控制的话，那它必然会遭到失败。 仔细回想起来，自己研究生期间确实是接触过不少的东西，但是自己没有一项是彻彻底底的去研究过的，大多的东西就是知识知道一些基本的原理和特征，没有真真正正的去钻研。研究对于我来说，已经结束了，剩下的就是要好好毕业，准备迎接工作中遇到的挑战。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/250/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>中国地名搜索引擎</title>
		<link>http://www.rushcj.com/laomi/archives/236</link>
		<comments>http://www.rushcj.com/laomi/archives/236#comments</comments>
		<pubDate>Tue, 27 Jul 2010 11:01:30 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[地名引擎]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=236</guid>
		<description><![CDATA[中国地名搜索引擎是天津大学计算机科学与技术学院，信息系统与软件工程研究所自己研发的关于中国地名的搜索引擎。目前搜索引擎中已经有40多万地名数据，全国的大多数的地名已经能够检索到。目前这个小组有教师一名、博士一名、硕士三名，目前发行的是一个简单的版本，虽然数据不是很完善，但是我们正在整理相关的数据，数据会越来越全的。 介绍了这么多，自己已经不是那个小组的成员了，作为地名引擎的创始人之一，觉得这个将会是我们实验室做应急的一个重要的里程碑，为今后收集数据和应急情景数据的管理提供了直接的参考依据。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/236/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>国语·邵公谏厉王弭谤</title>
		<link>http://www.rushcj.com/laomi/archives/214</link>
		<comments>http://www.rushcj.com/laomi/archives/214#comments</comments>
		<pubDate>Fri, 16 Apr 2010 04:33:20 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[国语]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=214</guid>
		<description><![CDATA[厉王虐，国人谤王，召公告曰：“民不堪命矣！”王怒，得卫巫，使监谤者。以告，则杀之。国人莫敢言，道路以目。 王喜，告召公曰：“吾能弭谤矣， 乃不敢言。”召公曰：“是障之也，防民之口，甚於防川。川壅而溃，伤人必多，民亦如之。是故为川者决之使导；为民者宣之使言。故天子听政，使公卿至於列士 献诗；瞽献曲；史献书；师箴；瞍赋；蒙诵；百工谏；庶人传语；近臣尽辨；亲戚补察；瞽史教诲；耆艾修之；而后王斟酌焉，是以事行而不悖。民之有口，犹土之 有山川也，财用於是乎出；犹其原隰之有衍沃也，衣食於是乎生；口之宣言也，善败於是乎兴。行善而备败，其所以阜财用衣食者也。夫民虑之於心，而宣之於口， 成而行之胡可壅也。若壅其口，其与能几何？” 王弗听，於是国人莫敢出言。叁年，乃流王於彘。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/214/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>语义搜索引擎&#8211;yebol</title>
		<link>http://www.rushcj.com/laomi/archives/71</link>
		<comments>http://www.rushcj.com/laomi/archives/71#comments</comments>
		<pubDate>Thu, 06 Aug 2009 08:14:04 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[语义搜索]]></category>
		<category><![CDATA[信息检索，体会]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=71</guid>
		<description><![CDATA[关于语义搜索引擎自己总是觉得很虚，每次在网上看到很多关于语义的搜索引擎的介绍。最近有一个又有一篇关于语义搜索引擎的报道，目前只要是看到这种的文章或者是报道，总感觉是在炒作，没人真正的去做语义搜索。 最近又被炒作的语义搜索的叫做yebol的搜索引擎，进入它的首页之后您可以看到&#8221;Knowledge Based (Semantic) Search&#8221;，但是现在进入系统之后发现已经被改掉了，改为&#8221;Knowledge Based (Smart) Search&#8221;（可以看到他的about页面还没有改过来）。因为自己这边老板一直吵着要做语义搜索引擎，一般对于关于声称自己是“（基于）语义的搜索”是非常关注的。yebol在介绍自己的时候既然连钱学森都扯到了，无语，目前这个基于知识的搜索引擎(这种说法我承认)采取显示搜索结果的方式还是有些不一样的，他所作的工作就是将搜索结果以分类的形式展现出来。比如在yebol中搜索&#8220;Bill Gates&#8221;，在返回界面中主要分为几种形式：Relate topic,Top Sites,Categories,Expanded Searches,Images,Vedioes,News,twitter和Search Result等。这种形式的搜索结果的显示方式，从一定的程度上说它组织了信息的显示形式，如果按照yebol中介绍的信息合和知识的主要区别在于：信息是静态的、未结构化的、以数据为中心的，而对于知识来说就是结构化的、按照语义做排序的以人为中心的。从目前的yehol的搜索结果的显示形式和定义来看，yehol它确实可以称之为“基于知识的搜索引擎”。看完它的介绍之后，总后自己还是有点失望，没有说到任何关于语义搜索的意思。 从目前自己对于语义搜索引擎的理解来看，要想做语义搜索引擎首先应该明确自己的检索对象，如果连自己要处理的对象都不明确的话，一切都是白搭。如果想想从semantic web的基础本体来看的话，构建本体的主要目的就是为了实现知识的共享，那人们如果去知道自己构建的本体是否别人已经构建过呢。所以，语义搜索引擎的主要目前就是检索目前网络中现有的本体，实现本体共享，从这个角度来思考的话，那么语义搜索引擎的主要对象就是本体文档、本体中术语(term)和本体中的关系，从这种关系来看的话，很有可能输入的是一个本体、本体中的某些术语或者是关系。如果说是想检索本体中的实例数据的话，那么检索的主要对象就是本体的实例，如果是这样的话那么的输入很有可能就是实例的数据。对于语义搜索引擎中，是否要考虑对本体或者是实例的推理呢，如果是针对本体实例搜索的话，那展现给用户的数据是否是更具体的信息呢？ 对于语义搜索自己也没有权利说的更多，只想通过更多的学习来让自己明白什么是语义搜索引擎。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/71/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>实时搜索OneRiot</title>
		<link>http://www.rushcj.com/laomi/archives/50</link>
		<comments>http://www.rushcj.com/laomi/archives/50#comments</comments>
		<pubDate>Fri, 24 Jul 2009 16:36:00 +0000</pubDate>
		<dc:creator>laomi</dc:creator>
				<category><![CDATA[江湖消息]]></category>
		<category><![CDATA[实时搜素]]></category>
		<category><![CDATA[OneRiot]]></category>
		<category><![CDATA[OneRiot Rank]]></category>

		<guid isPermaLink="false">http://www.rushcj.com/laomi/?p=50</guid>
		<description><![CDATA[前段时间老板一直催着我要实时搜索引擎，自己常常不以为然，因为现在炒作概念炒作的实在是太夸张了。但是什么是搜索引擎？直观上理解就是能够及时的在搜索结果中展现搜索相关的最近内容。在The Inner Workings of a Realtime Search Engine中指出：在搜索引擎的用户中，有60%的人用它来寻找特定的信息和导航信息(比如为了查找 rushcj.com等特定的主页信息)，其他的40%的人是想知道设个时候发生什么或者是特定的话题最近进展,而实时搜索引擎就能很好的解决这个问题。 对于搜索引擎来说，一般的过程是：先将相关的网页信息从网络上爬去下来，然后对网页的内容进行抽取（对于中文还需要分词），然后建立索引，建立索引之后的索引库就可以给用户进行检索信息的。基于这个过程我们可以知道，用户想要或得实时的数据信息，那么这一过程就必须在比较短的时间内完成，因为之后进入索引库之后的数据才能够被用户检索。 其实关于实时搜索引擎的概念很早就人提出来了，很多公司或者实验室一直没有没有很好的进展的主要原因是因为有两个问题没有很好的解决：一个是对实时爬取下来的信息进行及时的索引，另一个就是rank的机制（这个直接体现在搜索质量上，目前这个也是几个搜索公司之间竞争的主要方面）。实时搜索引擎来说，实时的更新索引数据信息时比较困难的，如果将要检索的对象针对于网上更新的数据去做的话，这将是一个浩大的工程。 OneRiot团队推出自己的实时搜索引擎，他们是如何解决上面的两个问题的呢？对于他们来说，他们采用一种新的方式去索引网页信息：主要针对于重要的实时社会网络。传统的搜索引擎爬去的数据主要是来自己已经有的网页中的链接的数据或者是人工手动添加的链接的数据。但是这两年以来，由于像facebook,twitter和饭否这样的实时信息社会网络共享的数据连接越来越多，OneRiot采取的一种方式就是分析从社会网络实时分享的数据链接来获取数据，并对数据进行索引。社会网络上的实时数据链接代表着大家在正在讨论什么？而链接中的数据就是关于讨论话题的网页内容信息和其他数据信息。这种方式是一种或者建立索引数据的新方法，当然他们还给用户提交了需要索引的网页的接口。对于OneRiot来说，他们对搜索结果中首先加入了搜索的结果离现在的时间是多久，另外一个就是对搜索结果又一个新的排序算法Pulse Rank，这种算法对于给搜索结果权重的计算考虑了多种因素： 对于一个实时搜索引擎的用户来说，对发生在2分钟前的事情比对发生在两个星期前的事情会更有兴趣。系统中也考虑了没有检索到相关的信息下，会现实最近最受欢迎信息的实时信息。 领域相关。对于一个从个人blog上发布的信息比一个从其他地方发布的系想你权重要高。算法会分析在此时特定领域的相关链接，对于一些比较流行的领域还会增加权重。 个人相关。算法会考虑是谁在共享这些链接，对于一个人重复的去分布一个链接，那么这个链接在算法中将会得到一个比较低的权重，对于一个链接有很多人重复共享的话，那么会在算法中得到一个较高的权重。 实时增加。算法对于一个共享的链接受欢迎程度是否增加。比如会考虑此时与两分钟相比共享的人数（单位时间内）是否增加，如果增加就就增加权重，减少就降低权重。 OneRiot确实能够实现信息的实时搜索，但是又能减少冗余数据的检索，而且能够及时的获取热门话题的数据。但是对一个好的实时搜索引擎，不仅仅是应该能够显示用户检索的实时信息，更应该能够为用户提供个性化的服务，例如实时的更新用户检索结果。]]></description>
		<wfw:commentRss>http://www.rushcj.com/laomi/archives/50/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->
