HtmlUnit 如何抓取自动提交后的页面？？？？？？

ss36290109 2012-07-11 01:06:03

HtmlUnit 如何抓取自动提交后的页面？？？？？？

  <body onload=loadUdb()></body>

比如当前页面有个这句话然后跳转到另一个页面。如何获取跳转页面的信息

...全文

90 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

ss36290109 2012-07-11

打赏
举报

回复

有人知道么。。。

学员朋友在学习课程之前，请仔细阅读以下内容↓ 本课程为入门课程，讲解基础课程、动态加载、自动化模拟采集。适合人群 Java初学者数据爱好者对爬虫感兴趣的同学你可以得到从0到1的爬虫编程方法...

作为一名互联网编辑，小编在日常工作中经常需要获取网页数据。而HTMLUNIT作为一种强大的Java库，可以帮助我们实现自动化的网页抓取，极大地提高了工作效率。下面，小编将分享一些关于使用HTMLUNIT抓取页面的经验。1.安装和配置HTMLUNIT首先，我们需要在项目中引入HTMLUNIT库。

HTMLUNIT是一款强大的Java库，用于模拟浏览器行为，实现网页抓取和自动化测试等功能。它可以帮助开发人员更便捷地获取网页数据，并进行数据分析和处理。下面将从多个方面介绍HTMLUNIT的使用方法及其在页面抓取中的优势。1.简介HTMLUNIT是基于Java开发的一款开源工具

介绍常用爬虫开源项目新浪微博爬虫和腾讯微博爬虫新浪爬虫的问题总结介绍相关简介即网络爬虫，是一种自动获取网页内容的程序。是搜索引擎的重要组成部分，因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。主要分类网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在

做Java编程的人其实，很多不懂SEO，也不知道如何让百度收录等等，当然，对于爬虫，网页抓取，也不是所有编程的人有考虑到，但是专门做这个人，还是需要了解一下这里面的知识的，那下面就来介绍一下一些爬虫和网页采集相关的组件和插件吧~ 大家在做爬虫、网页采集、通过网页自动写入数据时基本上都接触过这两个组件（权且称之为组件吧），网上入门资料已经很多了，我想从实际的应用角度谈谈我对于这两个组件的看法，并记

67,513

社区成员

225,879

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章