67,542
社区成员
发帖
与我相关
我的任务
分享
,愁...有没有人有个例子可以给我参考下啊
需要打开这个Network connect才能继续访问下面的页面,不知道在爬虫中怎么打开执行这个程序 ,头疼
,本来想用Java执行js方法试试可是不能识别window对象 ,报错
自己试没成功过。
public static void main(String[] args) throws Exception{
String username = "******";
String password = "******";
String session = getsessionInfo(username, password);
// spiderWebsite(session, "****");
}
//获取sessionId data("loginname", username,"agentpwd",pwd)
private static String getsessionInfo(String username , String pwd) throws Exception{
//登录网站
Connection.Response res =Jsoup.connect("https://passport.csdn.net/account/verify")
.userAgent("Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/58.0")
.data("username", username,"password",pwd)
.method(Connection.Method.POST)
.timeout(10000)
.execute();
System.out.println("返回得状态吗"+res.statusCode());
//获取session id
String session = res.cookie("JSESSIONID");
return session;
}
//爬取目标网站
// private static void spiderWebsite(String sessionid,String url) throws Exception{
//
// //爬取
// Document doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/58.0")
// .cookie("JSESSIONID", sessionid).timeout(10000).post();
// System.out.println(doc);
//
//
// }