java抓取动态页面数据,js处理的请求做了安全限制,使用jsoup或HttpURLConnection 都获取不到数据

qq_17173173 2018-08-14 05:29:51
String url = "https://www.aicoin.cn/news/all";
Response res = Jsoup.connect(url).header("Accept", "*/*").header("Accept-Encoding",
"gzip, deflate").header("Accept-Language", "zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3").header(
"Content-Type", "application/json;charset=UTF-8").header("User-Agent",
"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0").timeout(
10000).ignoreContentType(true).execute();

String body = res.body();
System.out.println(body);

或是
URL url2 = new URL(url);

URLConnection connection = url2.openConnection();

connection.setConnectTimeout(1000);

reader = new InputStreamReader(connection.getInputStream(), "UTF-8");

in = new BufferedReader(reader);

String line = null; // 每行内容

StringBuffer content = new StringBuffer();

while ((line = in.readLine()) != null)
{

content.append(line);

}
...全文
387 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_17173173 2018-09-29
  • 打赏
  • 举报
回复
我也是这个思路,不过之后我使用了casperjs,直接模拟登录,返回需要采集的信息,最后用Jsoup解析。你的方法试过了,但是有点复杂,没成功,不过我也是通过你的思路才想到的使用casperjs的。谢谢。
tianfang 2018-08-16
  • 打赏
  • 举报
回复
使用java 调用 Selenium WebDriver

https://blog.csdn.net/a542551042/article/details/45872265

50,523

社区成员

发帖
与我相关
我的任务
社区描述
Java相关技术讨论
javaspring bootspring cloud 技术论坛(原bbs)
社区管理员
  • Java相关社区
  • 小虚竹
  • 谙忆
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧