java SWT 调用IE内核开发的浏览器,请问如何控制下载的内容。(不下载图片等多媒体)

barrychenzhipinglan 2011-06-02 10:40:32
java SWT 调用IE内核开发的浏览器,请问如何控制下载的内容。(不下载图片等多媒体)
现在要做个爬虫,必须通过调用浏览器内核获得执行js后的页面源代码,但是不需要去下载图片等资源(默认要下载,太消耗时间),请问哪位高手能给点意见
...全文
404 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
just_for_download1 2013-08-15
  • 打赏
  • 举报
回复
最近也在研究爬虫,请私信一下我。
  • 打赏
  • 举报
回复
怎么高手还没出现啊??!!!
  • 打赏
  • 举报
回复
C 和 VB 里面可以通过调用IE开放的接口来实现下载控制
但是就是不知道怎么通过java来调用,swt听过的IE实现没有找到对应的功能
倒是提供了禁止js执行的功能接口
继续等待牛人........
  • 打赏
  • 举报
回复
等待牛人出招啊!!
  • 打赏
  • 举报
回复
需要通过用编程的手段来实现(swt)
orangemike 2011-06-03
  • 打赏
  • 举报
回复
说实话,无论如何你这个性能都不会很好.
如果真的是很有前途的长期项目,我建议你研究一下SWT集成xulrunner .那个可订制性更强,而且性能也好.
orangemike 2011-06-03
  • 打赏
  • 举报
回复
那你就监听页面加载事件,一加载完毕就通过执行一段js把所有的Img元素src改为空.
这样虽然不完美,但是应该大部分的img都不会再加载的.
orangemike 2011-06-02
  • 打赏
  • 举报
回复
修改ie设置不显示图片... ...

62,615

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧