社区
Java SE
帖子详情
急, java 中如何实现 utf-8 到 ucs-2 ( ISO-10646-UCS-2 ?) 的转换.
jekend
2006-11-02 05:43:53
不知道有什么办法将 utf-8 的字串转成 unicode( ucs-2 )?
我用了
new String(str.getBytes("UTF-8"),"ISO-10646-UCS-2");
但是得到一堆问号
另外, ucs-2 与 UTF-16 是什么关系, 有人说他们是一样的,不知道真假的.
...全文
665
6
打赏
收藏
急, java 中如何实现 utf-8 到 ucs-2 ( ISO-10646-UCS-2 ?) 的转换.
不知道有什么办法将 utf-8 的字串转成 unicode( ucs-2 )? 我用了 new String(str.getBytes("UTF-8"),"ISO-10646-UCS-2"); 但是得到一堆问号 另外, ucs-2 与 UTF-16 是什么关系, 有人说他们是一样的,不知道真假的.
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
bign_hdl
2006-11-03
打赏
举报
回复
可能没没进行异常处理,空值判断吧
public static String toISO(String strvalue) {
try{
if (strvalue == null)
return null;
else
strvalue = new String(strvalue.getBytes("utf-8"), "ISO-10646-UCS-2");
return strvalue;
}catch(Exception e){
return null;
}
}
oreno
2006-11-03
打赏
举报
回复
强制转换
laoliucn
2006-11-03
打赏
举报
回复
不知java的native2ascii命令可否满足需要。
jekend
2006-11-03
打赏
举报
回复
没人做过吗?
twenty_three
2006-11-02
打赏
举报
回复
up
healer_kx
2006-11-02
打赏
举报
回复
UP
CharsetUtils.
java
* 字符编码工具类 , 主要方法:1)获取传入字符串的编码格式 2)根据新的编码格式生成新字符串 /** 7位ASCII字符,也叫作
ISO
646-US、Unicode字符集的基本拉丁块 */ US_ASCII("US-ASCII","位ASCII字符,也叫作
ISO
646-US、Unicode字符集的基本拉丁块 "),
ISO
_8859_1("
ISO
-8859-1","
ISO
拉丁字母表 No.1,也叫作
ISO
-LATIN-1"), UTF_8("
UTF-8
","8 位
UCS
转换
格式"), UTF_16BE("UTF-16BE","16 位
UCS
转换
格式,Big Endian(最低地址存放高位字节)字节顺序"), UTF_16LE("UTF_16LE","16 位
UCS
转换
格式,Big Endian(最低地址存放高位字节)字节顺序"), UTF_16("UTF_16","16 位
UCS
转换
格式,字节顺序由可选的字节顺序标记来标识"), GBK("GBK","
中
文超大字符集");
java
中
GBK与
UTF-8
编码的
转换
java
中
文件编码的
转换
,主要说明了GBK与
UTF-8
编码之间的
转换
, 还介绍了利用cpdetector开源库确定文件文件(网页)编码的方法。
【原】
UCS
-2和
UTF-8
的互相
转换
我们都知道对于UNICODE来说,
UCS
-2是内码,而
UTF-8
则是它的
实现
方式。每一个字节都有8个位,而对于
UTF-8
来说,每一个字节的前两位尤为重要,按照前两位的不同,一共有四种排列组合:00xxxxxx,01xxxxxx,10xxxxxx,11xxxxxx。 按照
UTF-8
标准, (1)所有以0开始的字节,都与原来的ASCII码兼容,也就是说,0xxxxxxx不需要额外
转换
,就是...
java
对方 GBK 乱码_【转】
Java
编码与乱码---GBK与
UTF-8
之间的
转换
【GBK转
UTF-8
】在很多论坛、网上经常有网友问“为什么我使用 new String(tmp.getBytes("
ISO
-8859-1"), "
UTF-8
") 或者 new String(tmp.getBytes("
ISO
-8859-1"), "GBK")可以得到正确的
中
文,但是使用 new String(tmp.getBytes("GBK"), "
UTF-8
") 却不能将GBK
转换
成UTF-...
计算机
ucs
汉字编码,字符编码基础知识 - Unicode,
UCS
,GBK,GB2312,
UTF-8
字符编码基础知识- Unicode,
UCS
,GBK,GB2312,
UTF-8
最近遇到一个Unicode和
UTF-8
关系比较的问题,之前在处理
中
文显示时也遇到过类似的问题,于是花时间学习了一下,在此做个总结归纳,借以加深理解。(本文多数内容均来自互联网,特此申明。)一、相关概念1、
UCS
/
ISO
10646
ISO
组织制定的国际标准
ISO
10646
定义了通用字符集(Universal Charact...
Java SE
62,615
社区成员
307,307
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章