关于java程序中url包含中文的奇怪问题!!!
我得到了一组pdf的链接,想把它们下载下来,代码大体如下:
URL url = new URL(pdf);
httpConnection = (HttpURLConnection)url.openConnection();
httpConnection.setConnectTimeout(10000);
httpConnection.setReadTimeout(30000);
httpConnection.connect();
InputStream in = httpConnection.getInputStream();
……
可以遇到了一个奇怪的问题。一开始我eclipse的编码方式设置的是UTF-8,即便网页中包含中文也可以正常下载。
后来遇到另外一些包含中文的url,不能成功建立http连接,只有把eclipse的编码方式改为gbk才可以。
也就是说都是含有中文的url,一个要求eclipse编码只能是UTF-8,一个要求只能是GBK,是什么原因??????
要求UTF-8编码的url:http://218.69.100.28/upload/File/其他服务/外国人签证、居留许可申请表.pdf
要求GBK编码的url:http://www.bjepb.gov.cn/bjhb/Portals/0/fujian/zwgk/kjbz/污染场地修复验收技术规范DB11T-783-2011.pdf
上面两个url在IE中都可正常访问。谢谢大家!!郁闷好久了。。。