想学习一种泛用的新闻收集方法,求指点

reginvalid 2009-09-08 10:36:17
是这样的,一些论坛没有RSS,但查看源代码,又发现主题标题和对应链接在一个特定的标识下,请教什么语言能够方便地定位这种特定的标识,并把标题和链接提取出来呢?

我是想做个这样的东西:
有定时器,能定时从指定的一堆论坛中提取帖子标题及对应链接;
能根据不同论坛设置不同标识来提取帖子标题
方便设置过滤词组,只显示含有过滤词组的标题
标题、对应链接能方便的显示在一个GUI中(网页最好)

要做成这种泛用型的新闻收集器,我该学习哪一门语言,看哪方面的教程呢?谢谢!
...全文
67 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
tantaiyizu 2009-09-08
  • 打赏
  • 举报
回复
蜘蛛 可以很好的做 这个事情
reginvalid 2009-09-08
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 xinyung 的回复:]
lz可以学习下正则表达式
[/Quote]

谢谢,这是提取的核心吧,我想先把输入输出的框架搭起来,用哪种语言开发需要了解的枝节最少?
xinyung 2009-09-08
  • 打赏
  • 举报
回复
lz可以学习下正则表达式

61,111

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧