用什么样的采集方法采集新闻比较好呢

csecong 2007-09-26 08:07:40
好多cms系统都集成了采集功能,需要提供前缀+内容+后缀的方式,根据提供的前缀和后缀把内容找出来,他是怎么实现的呢?是不是先根据前缀将网页拆分成组,取第二个组,然后再根据后缀接着将这个组继续拆分成组,分组后的第一个部分就是内容了呢??

如果用正则直接取会不会更好??
...全文
149 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
Jinglecat 2007-09-26
  • 打赏
  • 举报
回复
根据具体页面特征标识信息,分析,选择解析方式

至于是否用正则,没有定论,正则也只是一种文本的解析方式——当然,正则绝对是把利剑!

16,554

社区成员

发帖
与我相关
我的任务
社区描述
VB技术相关讨论,主要为经典vb,即VB6.0
社区管理员
  • VB.NET
  • 水哥阿乐
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧