关于HTMLparser 过滤有特殊标记标签

阿诺 2012-01-06 02:31:41
我只想要抓取网页中的某部分的内容 而不是全部内容。我看网页源码 发现我要的那部分内容在div中。但是如果我如下这样写:
NodeFilter filter = new TagNameFilter("div");那么就把很多别的div内容也得到了。
如:
<divclass="1">
<divclass="2">
<div class="2.1">
XXXXXXXXXX
</div>
<div class="3">
我只要这div内的内容
</div>

</div>

</div>
比如就这样的结构 如果NodeFilter filter = new TagNameFilter("div"); 所有的内容都抓取到了
但是我要的只是
<div class="3">
我只要这div内的内容
</div>
这里面的内容 有什么办法呢?HTMLparser有这方面的方法吗?
谢谢了啊!!!!!

...全文
117 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
阿诺 2012-01-09
  • 打赏
  • 举报
回复
这是为什么呢 一个人也没有啊!

51,409

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧