java如何下载网友内容?

wonkju 2015-07-08 10:09:20
关键是需要登录, 有点难搞, 第二次请求的时候, 返回值说是200,但是什么内容也没有。
...全文
205 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
wonkju 2015-07-17
  • 打赏
  • 举报
回复
上面的哥们, 帮看一下, 主要是获取不到最新的数据. 好像我没使用上cookie. 我通过浏览器分析头部信息为
Request URL:http://szhsyh.ezhanyun.com/X_UserLogic/hesheng2015/320_JsonList/?CPPP=%E5%85%A8%E9%83%A8&CPLB=%E5%85%A8%E9%83%A8&keyword=
Request Method:GET
Status Code:200 OK
Response Headers
 (6)
Request Headers
view source
Accept:application/json, text/javascript, */*; q=0.01
Accept-Encoding:gzip, deflate, sdch
Accept-Language:zh-CN,zh;q=0.8
Connection:keep-alive
Cookie:ASPSESSIONIDCSQCCCRA=JCEJEBHDKFKKMMMDEHKCFLJE; X6AdminLimit6=; X6AdminLimit5=; X6AdminLimit4=%2C4%2EB%2C4%2EC%2C4%2ED%2C4%2EE%2C3%2EB%2C3%2EC%2C3%2ED%2C3%2EE%2C10%2EA%2C5%2EB%2C5%2EC%2C5%2ED%2C5%2EE%2C56%2EB%2C56%2EC%2C56%2ED%2C56%2EE%2C6%2EB%2C6%2EC%2C6%2ED%2C6%2EE%2C400%2EA%2C401%2EB%2C401%2EC%2C401%2ED%2C; X6AdminLimit3=%2CModule4%2CModule3%2CModule5%2CModule56%2CModule6%2CModule2%2CModule1%2CModule319%2CModule403%2CModule404%2CModule408%2CModule388%2CModule357%2CModule358%2CModule359%2CModule360%2CModule362%2CModule361%2CModule327%2CModule320%2CModule321%2CModule322%2CModule323%2CModule324%2CModule325%2CModule341%2CModule396%2CModule295%2CModule296%2CModule297%2CModule298%2CModule299%2CModule300%2CModule301%2CModule302%2CModule303%2CModule304%2CModule305%2CModule316%2CModule317%2CModule318%2CModule409%2CModule447%2CModule448%2CModule449%2CModule450%2CModule451%2CModule452%2CModule453%2CModule454%2CModule7%2CModule90%2CModule91%2CMenu35%2CSee389%2CSee390%2CMenu33%2CMenu34%2CMenu36%2CSee120%2C4%2EB%2C4%2EC%2C4%2ED%2C4%2EE%2C3%2EB%2C3%2EC%2C3%2ED%2C3%2EE%2C10%2EA%2C5%2EB%2C5%2EC%2C5%2ED%2C5%2EE%2C56%2EB%2C56%2EC%2C56%2ED%2C56%2EE%2C6%2EB%2C6%2EC%2C6%2ED%2C6%2EE%2C400%2EA%2C401%2EB%2C401%2EC%2C401%2ED%2C; X6AdminLimit2=%2C; X6AdminLimit1=%2C; AdminLimitStr=%2C8%2C12%2C; X6AdminLimitId=1; X6AdminTime=2015%2D7%2D17+0%3A06%3A23; X6%5FAdmin%5FLimit=1; X6%5FAdmin%5FValueM=%E9%A1%BA%E4%B8%B0%2D23%3A20; X6%5FAdmin%5FValueJ=%E6%89%8B%E6%9C%BA; X6%5FAdmin%5FValueH=%E5%BA%97%E9%95%BF; X6%5FAdmin%5FValueG=755013669; X6%5FAdmin%5FValueF=%E4%BA%8C%E7%B1%BB%E4%BB%B7; X6%5FAdmin%5FValueE=%E9%A9%AC%E5%90%AF%E7%8F%8D; X6%5FAdmin%5FValueB=%E5%90%B4%E5%A4%A7%E5%BC%BA; X6%5FAdmin%5FValueA=%E7%8E%B0%E6%AC%BE%E5%AE%A2%E6%88%B7; X6%5FAdmin%5FCity=%E4%B8%9C%E8%8E%9E%E5%B8%82; X6%5FAdmin%5FProvince=%E5%B9%BF%E4%B8%9C%E7%9C%81; X6%5FAdmin%5FMobile=18688626226; X6%5FAdmin%5FAddress=%E9%95%BF%E5%AE%89%E9%95%87%E4%B9%8C%E7%BA%B1%E5%85%B4%E5%9B%9B%E8%B7%AF%EF%BC%91%EF%BC%90%EF%BC%90%E5%8F%B7; X6%5FAdmin%5FName=%E5%B9%BF%E4%B8%9C%E4%B8%9C%E8%8E%9E%E9%95%BF%E5%AE%89%E4%B8%AD%E5%9B%BD%E7%94%B5%E4%BF%A1%E9%A9%AC%E5%90%AF%E7%8F%8DX%2FC; X6AdminPass=8855c4efa678474c; X6AdminName=18688626226; CloseSysHidden=0; X6AdminIp=183%2E16%2E88%2E83; X6AdminId=12896
Host:szhsyh.ezhanyun.com
Referer:http://szhsyh.ezhanyun.com/x/?Action=List&Type=2&Module=320
User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36
X-Requested-With:XMLHttpRequest
Query String Parameters
view source
view URL encoded
CPPP:全部
CPLB:全部
keyword:
wonkju 2015-07-17
  • 打赏
  • 举报
回复
引用 楼主 king769147 的回复:
关键是需要登录, 有点难搞, 第二次请求的时候, 返回值说是200,但是什么内容也没有。
我试过了很多次, 主要问题是, 获得是数据不是最新的. 代码为:
static final String LOGON_SITE = "szhsyh.ezhanyun.com" ;
	static final int     LOGON_PORT = 80; 
	@Override
	public String initCookie(User user) throws HttpException, IOException {
		 HttpClient client = new HttpClient(); 
	     client.getHostConfiguration().setHost(LOGON_SITE, LOGON_PORT); 

	      // 模拟登录页面 login.jsp->main.jsp 
//	      PostMethod post = new PostMethod( "/X_UserFileLogic/X_hesheng2.0/X_Login" ); 
//	      NameValuePair name = new NameValuePair( "AdminName" , "18688626226" ); 
//	      NameValuePair pass = new NameValuePair( "AdminPass" , "qaz123" ); 
//	      post.setRequestBody( new NameValuePair[]{name,pass});
	      GetMethod get=new GetMethod("/X_UserFileLogic/X_hesheng2.0/X_Login?X6AdminName=18688626226&X6AdminPass=qaz123"); 
	      int status = client.executeMethod(get);
System.out.println("status:" + status);	      
//	      System.out.println(post.getResponseBodyAsString()); 
	      //post.releaseConnection(); 

	      // 查看 cookie 信息 
	      CookieSpec cookiespec = CookiePolicy.getDefaultSpec(); 
	      Cookie[] cookies = cookiespec.match(LOGON_SITE, LOGON_PORT, "/" , false , client.getState().getCookies());
	      String cookie = null;
	      if (cookies.length == 0) { 
	         System.out.println( "None" ); 
	      } else { 
	         for ( int i = 0; i < cookies.length; i++) { 
	        	cookie = cookies[i].toString();
	            System.out.println(cookie); 
	         } 
	      } 

	      // 访问所需的页面 main2.jsp 
	      get=new GetMethod("/X_UserLogic/hesheng2015/320_JsonList/?CPPP=%E5%85%A8%E9%83%A8&CPLB=%E5%85%A8%E9%83%A8&keyword=");
	      get.setRequestHeader("Connection", "keep-alive");
	      get.setRequestHeader("Referer", "http://szhsyh.ezhanyun.com/x/?Action=List&Type=2&Module=320");
	      get.getParams().setCookiePolicy(CookiePolicy.RFC_2965);
	      get.setRequestHeader("Cookie", cookie);
	      client.executeMethod(get); 
  System.out.println("r:" + get.getResponseBodyAsString()); 
	      get.releaseConnection(); 
		return null;
	}
JPF1024 2015-07-09
  • 打赏
  • 举报
回复
发起请求,模拟登录,然后在抓取分析HTML数据。
oh_Maxy 2015-07-08
  • 打赏
  • 举报
回复
在打开目标页面URL之前,先通过HttpClient方式登录,这样再打开目标网址,就不会再跳转登录页了。
finemi 2015-07-08
  • 打赏
  • 举报
回复
无非就是分析好请求所带的request头及response头信息
市面上能下载的《算法导论》中文版都没有目录(标签),阅读极不方便,翻阅困难。本人(crocostone)亲自手动制作了完整的标签,包括章、节、小节的标签,在Acrobat 7.0和9.0版本和FoxitReader 4.2版本均能打开。 而且,我精心调整了文档的大小,打开或点击标签的时候,默认就是最适合阅读、眼睛最舒服的文档大小,无需再调整大小。 本人亲自制作,在CSDN上奉献,欢迎使用!有了目录(标签),学习效率真的可以提高一大截啊!!!注意本压缩包使用WinRAR分卷压缩,4个部分都下载后才能解压! 为什么要分卷:整个文件有130MB,crocostone的上传权限不够,所以只能分卷压缩。已经测试:这4个压缩包,使用WinRAR/7zip/Haozip都能正确解压!!! 内容: 1、全世界唯一带“完整”目录的《算法导论》第二版中文版。 2、目前能找到的多个版本的习题答案和代码,有Java实现的,C++实现的,官方的、非官方的,教参,考试题答案等等! 3、讲义。 书籍介绍: 《算法导论》(Introduction to Algorithms)原书第二版,Thomas H. Cormen(科曼)、Charles E. Leiserson、Ronald L.Rivest、Clifford Stein著,南京大学潘金贵、顾铁成、李成法、叶懋等译,机械工业出版社,2006。本书简称CLRS,麻省理工学院教材,全世界最广泛使用的算法超经典书籍,学习编程必看之书。作者之一的Rivest就是RSA算法发明者的R,2002年图灵奖得主。算法是程序员必练内功。此书主要讨论算法,数据结构方面的内容稍少。中文翻译质量不错。 ########################【对于crocostone本人前面发的算法导论的资源的说明】########################### download.csdn.net/source/3109111和download.csdn.net/source/3109150是一套两个部分的压缩文件,后缀名是001和002,不要改名,只能用7zip和Haozip解压,用WinRAR无法解压,解压后是带章、节、小节目录的算法导论。 download.csdn.net/source/3108513和download.csdn.net/source/3108520是另一套两个部分的压缩文件,后缀名是001和002,不要改名,只能用7zip和Haozip解压,用WinRAR无法解压,解压后是带章目录的算法导论,但是没有节和小节的目录。 本人的电脑以前没有WinRAR,而是一直使用7zip,但是7zip制作的zip分卷压缩格式竟然与WinRAR不兼容,导致前面发的资源,用WinRAR的网友说无法解压,在这里表示抱歉!使用7zip或Haozip的人都解压成功了。 这次发的资源,4个压缩包,使用WinRAR/7zip/Haozip都能正确解压! 请CSDN网友下载完,评论的同时,要点击评论框上方的五角星(共5个五角星),这样你的被扣的积分就可以返还,还会加一分。如果只评论,不点击小五角星,积分不会返还。一定要先下载完,再评论。如果先评论后下载,或者在下载的过程中评论,积分同样不会返还。 数据结构教材,我强烈推荐Sartaj Sahni著《数据结构算法与应用——C++语言描述》。这是一部难得的好书,作者循序渐进,娓娓道来,每一种数据结构和算法都给出了详细的实现代码和运行结果,而且代码质量极高,甚至可以直接照搬到商业软件开发中。此书的算法部分也很精到,比算法导论更容易学习和入门。Sartaj Sahni《数据结构算法与应用——C++语言描述》全集,包含中英文图书、代码、习题答案、演示动画,都是我亲自从此书的官方网站下载并汇总的,绝对权威,请在这里下载:download.csdn.net/source/3043982 算法和数据结构是计算机的绝对核心技术。学好核心技术,既为了自己,也为了天空不落下别国的炸弹!!!
ndroid系统源代码情景分析的评论 这本书是我看过的最深入的一本android书了,可以看出作者是一个很有悟性的程序员,很适合需要提高的android框架层工程师进阶。binder部分是目前所有书中分析的最全面的。匿名共享内存分析的也很好。 情况分析应该是学毛德操老师的,作者确实做到了,作者在讲解时,会从java层到native层,再到linux kernel中整个串起来讲。使读者可以完全了解某些子系统的运行机制 内容简介 · · · · · · 在内容上,本书结合使用情景,全面、深入、细致地分析Android系统的源代码,涉及到Linux内核层、硬件抽象层(HAL)、运行时库层(Runtime)、应用程序框架层(Application Framework)以及应用程序层(Application)。 在组织上,本书将上述内容划分为初识Android系统、Android专用驱动系统和Android应用程序框架三大篇章。初识Android系统篇介绍了参考书籍、基础知识以及实验环境搭建;Android专用驱动系统篇介绍了Logger日志驱动程序、Binder进程间通信驱动程序以及Ashmem匿名共享内存驱动程序;Android应用程序框架篇从组件、进程、消息以及安装四个维度来对Android应用程序的框架进行了深入的剖析。 通过上述内容及其组织,本书能使读者既能从整体上把握Android系统的层次结构,又能从细节上去掌握每一个层次的要点。 作者简介 · · · · · · 罗升阳,1984年出生,2007年毕业于浙江大学计算机系,取得学士学位,2010年毕业于上海交通大学计算机系,取得硕士学位。毕业后一直从事于互联网软件开发,并且致力于移动平台的研究,特别是对Android平台有深入的理解和研究。在国内知名IT技术社区CSDN上发表了数十篇高质量的Android系统原创性文章,并且开设博客专栏--《老罗的Android之旅》,积极与网友互动,深受大家喜爱,访问量一直居于前茅。

62,616

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧