估计得忙一阵子了
Posted: October 17th, 2009 | Author: laomi | Filed under: 开发日志 | Tags: 信息检索, 地名引擎 | No Comments »自己这一年多来一直忙着实验室的那点项目,说句实话现在做的东西真的是很难投入使用,目前自己的总结原因有:开发氛围不好,简单的来说很多人都没有把这项目当回事(估计老板也差不多),所以从项目管理上很难入手;业务分析不够透彻,做软件产品的话,就必须得好好的分析一下实际情况,我们基本上是凭空想象。最近老板又让我做地名引擎,说句实话,我的兴致很高,就怕哪一天他对这个不感兴趣,我又是瞎折腾了。
目前总体上可以这么说,地图数据我们已经有了,至于这个地名引擎不在于地图本身,其主要是基于地名数据基础之上的。自己大概花了两天的时候好好的将自己要做的东西勾勒了一下,然后将自己第一期要完成的目标也确定了一下,最后定了一下关于地名引擎的技术基础。我们实验室是做应急方向的,所以我们做的地名引擎其主要的还是围绕着应急。关于这个系统我前面的工作主要是将把他当做一个系统来完成,解决问题的方法也主要是从工程的角度来思考(说句实话,在实验室做研究我实在是不怎么感兴趣,因为……)。第一期的主要目的就是将实验室目前的数据以地名为中心展现出来,其主要的开发的环境:
OS:ubuntu8.10
开发语言:java
第三方工具:htmlparser、lucene 2.4
从目前的角度上来说,从网上爬取过来的数据相对来说都比较简单,所以数据抽取部分的工作相对来说就比较简单了。前天自己花了点时间,大概的分析了一下系统的基本功能,根据自己的一些理解之后大概的确定了一下程序的主要框架结构,然后自己用java代码写了一下程序的框架结构。从设计模式的角度来思考的话,目前自己主要是参考了观察者模式。计划在下周六能够直接用lucene将地名的索引先创建出来,然后根据用户输入的地名信息,将把介绍地名的相关数据先展现出来。不过这里面可能会出现一些问题,哪就是搜索条件的扩展问题,目前关于这个问题的解决办法还没有想出来。
现在没有拿到完全的数据,至于根据一个地名到底需要展现多少信息目前来说还确定不了(不知道这个是不是就是他们博士们在讨论的不确定性分析)。为了保证数据展现的精确性,所以在地名处理方面要做的工作还是很多的,比如:如何在一个案例中,描述的信息不够完备的情况下,能比较准确的描述事件发生的地点信息等。
今天只是一个开始,今后将自己在开发地名引擎遇到的相关问题和自己一些思考总结下来,希望能够得到各位高手的指点。









Leave a Reply