utf-8编码问题
我自己写了一个程序,是从网上抓页面上的内容,然后整理给用户看,可是我发现当别人的网页编码使用utf-8的时候,我就没有办法获得正确的中文了。
我搜索了一下帖子,发现大多数人都有utf-8的问题,并且一般都是在web中碰到的,其作法就是改charset,可是我的程序与web无关,我抓取内容后,在textarea中显示,我尝试
content = new String(content.getBytes("UTF-8"), "GB2312");
可是出来的却是乱码,后来我做了一个测试,发现utf-8不能转换为gb2312
String ttt = "我是中文";
ttt = new String(ttt.getBytes("GB2312"), "UTF-8"); //ttt = ��������
ttt = new String(ttt.getBytes("UTF-8"), "GB2312"); //ttt = 锟斤拷锟斤拷锟斤拷锟斤拷
最后“我是中文”这几个汉字就变成了“锟斤拷锟斤拷锟斤拷锟斤拷”这种乱七八糟的东西了,请问,utf-8要转换成gb2312该怎么解决?