想抓取html中一段内容,有现成的开源软件包吗

big_world 2011-07-17 10:45:02
看了这些html格式固定的,想抓取其中一段内容。想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊
...全文
93 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
big_world 2011-07-17
  • 打赏
  • 举报
回复
多谢,我也这么理解的,看了一楼的回复觉得很迷惑。我自己实现了解析的,主要是不懂html语法,解析总是不对,原来是注释。多谢
[Quote=引用 6 楼 aspwebchh 的回复:]

js抓不了别人的。
去学点服务器端技术,如asp,asp.net
就可以抓了
至于开发包什么的,你网上搜搜看。这些东西以经很简单了,没必要再加工了
asp可以用 MSXML2.XMLHTTP 组件
.net更方便 直接使用类型 WebRequest WebResponse
[/Quote]
big_world 2011-07-17
  • 打赏
  • 举报
回复
年轻人就喜欢下结论,傻逼
[Quote=引用 7 楼 theforever 的回复:]

引用楼主 big_world 的回复:
想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊

又想自己写,又要用现成工具,这不矛盾吗。就是想把别人成果换成自己名字?
不会就学,没什么可说的,如果没有技术人的基本特征,就没什么可说的了。
[/Quote]
itakeblue 2011-07-17
  • 打赏
  • 举报
回复
js/asp等都能实现,xmlhttp抓取网页并分析,网上很多搜索下
big_world 2011-07-17
  • 打赏
  • 举报
回复
js是基于浏览器的,抓自己嵌入的网页内容很简单,我是搞不明白抓已经生成的网页是如何设计的,请高人赐教。如果你懂的话。否则........[Quote=引用 4 楼 lsw645645645 的回复:]

引用 2 楼 big_world 的回复:
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现


没做过web开发。跟你说了,你也不懂啦。
[/Quote]
  • 打赏
  • 举报
回复
[Quote=引用楼主 big_world 的回复:]
想自己写代码解析html中的tag以读取内容。
不知道有没现成的工具或者开源软件包啊
[/Quote]
又想自己写,又要用现成工具,这不矛盾吗。就是想把别人成果换成自己名字?
不会就学,没什么可说的,如果没有技术人的基本特征,就没什么可说的了。
big_world 2011-07-17
  • 打赏
  • 举报
回复
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现[Quote=引用 1 楼 xiaodalei 的回复:]

在js里倒是可以实现啊。这个需要吗?
[/Quote]
xiaodalei 2011-07-17
  • 打赏
  • 举报
回复
在js里倒是可以实现啊。这个需要吗?
挨踢直男 2011-07-17
  • 打赏
  • 举报
回复
js抓不了别人的。
去学点服务器端技术,如asp,asp.net
就可以抓了
至于开发包什么的,你网上搜搜看。这些东西以经很简单了,没必要再加工了
asp可以用 MSXML2.XMLHTTP 组件
.net更方便 直接使用类型 WebRequest WebResponse
Cyril851122 2011-07-17
  • 打赏
  • 举报
回复
perl
lsw645645645 2011-07-17
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 big_world 的回复:]
我想抓取别人生成好的网页,我没做过web开发,不过如果js实现方便,可以讲解一下思路,我自己实现

[/Quote]
没做过web开发。跟你说了,你也不懂啦。

61,115

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧