关于htmlparser

haha_321 2013-10-15 03:35:55
最近在关于htmlparser关于网页抓取的东东,有个子节点的方法不明白求教各位一下,如图
这个getchild(1)方法中的数字是怎么得来的,这个节点是怎么划分的呢?怎么才知道他是第几个呢?
...全文
299 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
haha_321 2013-10-15
  • 打赏
  • 举报
回复
引用 1 楼 shixitong 的回复:
有没有getChildren方法,你代码不全,那个1应该是直接写死的
没有,应该是用的CompositeTag.java这个里的getChild方法。
haha_321 2013-10-15
  • 打赏
  • 举报
回复
引用 2 楼 dollyn 的回复:
你想要第几个自己不清楚么。。。

我不是不知道想要第几个,我根本就不知道他是第几个
如图这部分,我getChild(1)得到
Tag (105495[1084,102],105499[1084,106]): h3
Tag (105499[1084,106],105603[1084,210]): a href="/deals/14230535" target="_bl...
Txt (105603[1084,210],105625[1084,232]): 7.5元 法乐 全脂牛奶1L 8盒起售
End (105625[1084,232],105629[1084,236]): /a
End (105629[1084,236],105634[1084,241]): /h3
getChild(2)Txt (105634[1084,241],105652[1085,16]): \n 这是为什么呢?为什么呢?1和2是怎么区分的呢?
霜之哀伤 2013-10-15
  • 打赏
  • 举报
回复
你想要第几个自己不清楚么。。。
shixitong 2013-10-15
  • 打赏
  • 举报
回复
有没有getChildren方法,你代码不全,那个1应该是直接写死的

50,530

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧