【散分+广告】老紫竹网页采集系统(lzzSearch 0.3版)发布

老紫竹 2009-02-02 05:51:12
老紫竹网页采集系统(LzzSearch)变更历史
===================================
2009-02-05 v0.3
---------------
* 增加了存储接口,可以将数据用不同的方式保存
* 确定系统里url是唯一的
* 调整 Lucene 实现存储接口
* 数据项增加了id属性,用来保存唯一的编号,比如lucene的docId,数据库的id主键等
* 增加基于数据库的存储实现(MySQL+JDBC),采用标准SQL
* 数据库存储使用了新的类库
commons-dbcp-1.2.2.jar
mysql-connector-java-5.1.7-bin.jar
commons-pool-1.4.jar
* 在源代码的sql目录下增加了MySQL 5.1.30 版的创建表格的SQL文件
* applicationContext.xml 增加了MySQL的数据源和对应的MySQL存储的配置
* 在demo里面增加了针对MySQL的测试例子
* 其它存储方式(比如文件存储)的实现,可以通过实现Store接口即可
* util下增加了一个DBUtil类,用来释放数据库资源


# 后面重点是功能展示部分,开发B/S的部分,至于C/S的,因为本人不熟悉,只好请"你"或者别的网友代劳了。
包括url添加,url搜索,内容检索这三个基本功能,稍后再增加用户注册等个性化部分。




2009-02-03 v0.2
------------------------
* 增加了对Lucene 2.4 的支持,保存采集内容并对提供搜索和内容更新
* 使用了庖丁解牛做中文分词
* 修正了 StrTools 里面对于<br />不能正确文本替换的BUG
* 增加了专用的TestLucene的演示程序
* 更改test目录名为demo
* 的Lucene的索引目录在applicationContext.xml里面进行修改,默认为 d:/indexpaoding/lzzSearch
* 调整了项目目录,将需要的5个jar都放到了项目内部,无需单独下载了
* 注意:庖丁所需要的dic我已经放到了系统内部,在src\dic下面
并且更新了paroding-analysis.jar里面的 paoding-dic-home.properties文件的配置




2009-02-02 v0.1
------------------------
* 基于Spring的配置,可以轻松的增加采集的站点
* 采集点包含标题,作者,发布时间和内容四部分
* 采集后的内容由用户自行


老紫竹网页采集系统
=================

功能介绍
-------
1 基于Spring的配置,可以轻松的增加采集的站点
2 采集点包含标题,作者,发布时间和内容四部分
3 采集后的内容由用户自行处理

安装配置
-------
1 程序我就不说了
2 配置文件 applicationContext.xml 里面有详细的注释
3 已经包含了CSDN论坛、博客园、新浪博客、百度Hi的解析参数

需要的类库
---------
1 Spring 2.5
2 common-logging 1.1

测试例子
-------
在com.laozizhu.search.test目录下面


后续工作
-------
1 集成Lucene,进行搜索
2 集成到网页上
3 提供用户提交网址,类似于收藏功能,不过带搜索的收藏哦

最终目标
-------
个性化的收藏和搜索系统

老紫竹的家
分享互联网的快乐与收获
http://www.laozizhu.com



下载和反馈地址http://www.laozizhu.com/view.jsp?articleId=720
...全文
247 37 打赏 收藏 转发到动态 举报
写回复
用AI写文章
37 条回复
切换为时间正序
请发表友善的回复…
发表回复
橄榄丝 2011-01-24
  • 打赏
  • 举报
回复
页面打不开
http://www.laozizhu.com/view.jsp?articleId=720
kokobox 2009-02-06
  • 打赏
  • 举报
回复
竹子
stevech 2009-02-06
  • 打赏
  • 举报
回复
不懂,接分~~
jiaping108 2009-02-06
  • 打赏
  • 举报
回复
400后第一个顶!嘿嘿
dream200829 2009-02-06
  • 打赏
  • 举报
回复
我也来接分,呵呵
fys249931556 2009-02-05
  • 打赏
  • 举报
回复
这里总是有惊喜啊。
junjun1984 2009-02-05
  • 打赏
  • 举报
回复
接分 支持
cuijie_cn 2009-02-05
  • 打赏
  • 举报
回复
接分 支持
zhj92lxs 2009-02-05
  • 打赏
  • 举报
回复
up
Landor2004 2009-02-05
  • 打赏
  • 举报
回复
支持!
老紫竹 2009-02-05
  • 打赏
  • 举报
回复
加分到400分喽!
Java_Chaos 2009-02-05
  • 打赏
  • 举报
回复

不客气了 UP
xiaoxuanfengsyn 2009-02-05
  • 打赏
  • 举报
回复
joejoe1991 2009-02-05
  • 打赏
  • 举报
回复
做小偷程序。。
老紫竹 2009-02-05
  • 打赏
  • 举报
回复
0.3版发布,支持Lucene和数据库存储(JDBC),其它的功能正在继续。。。。
csgdseed 2009-02-04
  • 打赏
  • 举报
回复
up支持
nqzwaityou 2009-02-04
  • 打赏
  • 举报
回复
原来老紫竹 名气很大啊! 加油!
nqzwaityou 2009-02-04
  • 打赏
  • 举报
回复
接分 谢谢~~
jianghuxiaoxiami 2009-02-04
  • 打赏
  • 举报
回复
mark by jianghuxiaoxiami
Daniel_Cao_ 2009-02-04
  • 打赏
  • 举报
回复
支持你。
加载更多回复(17)

23,404

社区成员

发帖
与我相关
我的任务
社区描述
Java 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧