java.net.URL抓取中文网页的问题

monkey 2008-09-17 10:22:47
我想抓取该网页
http://www.ocs.co.jp/multitracking/tracking/template/MultiQuery.vm/action/MultiTracking?new=true&customer=true&CWBs=31360638562
直接在ie里输入上面这个地址里面的内容显示是中文,但是如果我用
url = new URL("http://wwwapps.ups.com/WebTracking/processInputRequest?HTMLVersion=5.0&loc=zh_CN&Requester=UPSHome&tracknum=31360638562
);reader = new BufferedReader(new InputStreamReader(url.openStream(),"GB2312"));
的话,reader.readLine()显示出来的是该网页的英文版,reader = new BufferedReader(new InputStreamReader(url.openStream(),"UTF-8"));也试过,也是英文,怎么才能抓到中文的
...全文
173 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhongwenly 2008-09-17
  • 打赏
  • 举报
回复
可能是实现了程序的国际化,把你的系统时区改到英语国家,看看还是不是中文的
monkey 2008-09-17
  • 打赏
  • 举报
回复
楼上的,我试了,去掉后面一个参数,输出的仍旧是英文啊
zhongwenly 2008-09-17
  • 打赏
  • 举报
回复
lz为什么要转换呢,
reader = new BufferedReader(new InputStreamReader(url.openStream())

输出的已经是中文了吧,试试看
monkey 2008-09-17
  • 打赏
  • 举报
回复
问题是同样的地址,我ie里输入的话就显示中文,用程序抓取就显示英文,真奇怪了啊
wenbinhua 2008-09-17
  • 打赏
  • 举报
回复
我猜想,服务器取得请求端(即你的电脑)的报头信息,你的操作系统是中文版的,那么,就国际化为中文页面内容回复你。

具体的,我也不太清楚了。

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧