httpUrlConnection 提取html 流 出现乱码!!!
从网站中抽取的html,编码的格式是iso-8859-1,是英文的网站,得到的html,有一些乱码,出现一些类似“ ” ,我的工作平台式win,这是编码问题。
URL link = new URL(url);
HttpURLConnection connection = (HttpURLConnection) link.openConnection();
connection.connect();
stream = connection.getInputStream();
reader2 = new BufferedReader(new InputStreamReader(stream, "ISO-8859-1"));
while ((sCurrentLine = reader2.readLine()) != null) {
htmls.append(sCurrentLine);
System.out.println(sCurrentLine);
}
htmls中会出现乱码。网站是英文的,编码是默认。
请问高手如何解决???
我也试过“uft-8”都一样