关于HTMLparser 过滤有特殊标记标签
阿诺 2012-01-06 02:31:41 我只想要抓取网页中的某部分的内容 而不是全部内容。我看网页源码 发现我要的那部分内容在div中。但是如果我如下这样写:
NodeFilter filter = new TagNameFilter("div");那么就把很多别的div内容也得到了。
如:
<divclass="1">
<divclass="2">
<div class="2.1">
XXXXXXXXXX
</div>
<div class="3">
我只要这div内的内容
</div>
</div>
</div>
比如就这样的结构 如果NodeFilter filter = new TagNameFilter("div"); 所有的内容都抓取到了
但是我要的只是
<div class="3">
我只要这div内的内容
</div>
这里面的内容 有什么办法呢?HTMLparser有这方面的方法吗?
谢谢了啊!!!!!