社区
Java SE
帖子详情
关于字符集常量类的问题?
wnss8888
2007-08-30 11:32:56
我们在编程时经常会转换字符集,比如UTF-8,iso-8859-1.之类的。
往往会采用硬编码。我在jdk里找了半天,这些值到底是哪个类的常量 。知道的告诉我一下。谢谢。
...全文
799
8
打赏
收藏
关于字符集常量类的问题?
我们在编程时经常会转换字符集,比如UTF-8,iso-8859-1.之类的。 往往会采用硬编码。我在jdk里找了半天,这些值到底是哪个类的常量 。知道的告诉我一下。谢谢。
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ykrocku
2007-09-03
打赏
举报
回复
楼主啊,字符集名在 Java 中定义的本身就不是常量。而是存储在一个 Map 之中的,通过存诸在 Map 中的名字,再去找到具体适用的字符集类再进行字符解析的。在这两个类中 sun.nio.cs.StandarCharsets、sun.nio.cs.ext.ExtendedCharsets 就是存储了些 map,像你上面调用 Charset.availableCharsets(); 这个方法也是从上面那两个类中获得的啊。
---------
BINGO~
火龙果被占用了
2007-09-03
打赏
举报
回复
楼主啊,字符集名在 Java 中定义的本身就不是常量。而是存储在一个 Map 之中的,通过存诸在 Map 中的名字,再去找到具体适用的字符集类再进行字符解析的。在这两个类中 sun.nio.cs.StandarCharsets、sun.nio.cs.ext.ExtendedCharsets 就是存储了些 map,像你上面调用 Charset.availableCharsets(); 这个方法也是从上面那两个类中获得的啊。
火龙果被占用了
2007-09-03
打赏
举报
回复
ISO-Latin-1 在java中到底对应哪一种编码。
对应 ISO-8859-1
wnss8888
2007-09-03
打赏
举报
回复
用这段代码可以查看到本系统内支持的字符集。
你们给我提供的类中都没有找到常量。
SortedMap<String, Charset> availableCharsets = Charset
.availableCharsets();
Set names = availableCharsets.keySet();
Iterator it = names.iterator();
while (it.hasNext()) {
String next = (String)it.next();
System.out.println(availableCharsets.get(next));
}
ISO-Latin-1 在java中到底对应哪一种编码。
Big5
Big5-HKSCS
EUC-JP
EUC-KR
GB18030
GB2312
GBK
IBM-Thai
IBM00858
IBM01140
IBM01141
IBM01142
IBM01143
IBM01144
IBM01145
IBM01146
IBM01147
IBM01148
IBM01149
IBM037
IBM1026
IBM1047
IBM273
IBM277
IBM278
IBM280
IBM284
IBM285
IBM297
IBM420
IBM424
IBM437
IBM500
IBM775
IBM850
IBM852
IBM855
IBM857
IBM860
IBM861
IBM862
IBM863
IBM864
IBM865
IBM866
IBM868
IBM869
IBM870
IBM871
IBM918
ISO-2022-CN
ISO-2022-JP
ISO-2022-KR
ISO-8859-1
ISO-8859-13
ISO-8859-15
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
JIS_X0201
JIS_X0212-1990
KOI8-R
Shift_JIS
TIS-620
US-ASCII
UTF-16
UTF-16BE
UTF-16LE
UTF-8
windows-1250
windows-1251
windows-1252
windows-1253
windows-1254
windows-1255
windows-1256
windows-1257
windows-1258
windows-31j
x-Big5-Solaris
x-euc-jp-linux
x-EUC-TW
x-eucJP-Open
x-IBM1006
x-IBM1025
x-IBM1046
x-IBM1097
x-IBM1098
x-IBM1112
x-IBM1122
x-IBM1123
x-IBM1124
x-IBM1381
x-IBM1383
x-IBM33722
x-IBM737
x-IBM834
x-IBM856
x-IBM874
x-IBM875
x-IBM921
x-IBM922
x-IBM930
x-IBM933
x-IBM935
x-IBM937
x-IBM939
x-IBM942
x-IBM942C
x-IBM943
x-IBM943C
x-IBM948
x-IBM949
x-IBM949C
x-IBM950
x-IBM964
x-IBM970
x-ISCII91
x-ISO-2022-CN-CNS
x-ISO-2022-CN-GB
x-iso-8859-11
x-JIS0208
x-JISAutoDetect
x-Johab
x-MacArabic
x-MacCentralEurope
x-MacCroatian
x-MacCyrillic
x-MacDingbat
x-MacGreek
x-MacHebrew
x-MacIceland
x-MacRoman
x-MacRomania
x-MacSymbol
x-MacThai
x-MacTurkish
x-MacUkraine
x-MS950-HKSCS
x-mswin-936
x-PCK
x-windows-50220
x-windows-50221
x-windows-874
x-windows-949
x-windows-950
x-windows-iso2022jp
火龙果被占用了
2007-08-30
打赏
举报
回复
标准字符集在 sun.nio.cs.StandarCharsets 类里定义了,扩展字符集在 sun.nio.cs.ext.ExtendedCharsets 类中定义了。
再根据这些包里的字符集类去解析。
火龙果被占用了
2007-08-30
打赏
举报
回复
可以使用 WinRAR 等工具打开这些 jar 文件,找到某些类(class文件),拖出来后,用 jad 等工具反编译一下,基本上就可以看到源代码了,有的源代码里竟还有标号和 goto 语句,可见这些 class 非 Java 编译的(或者是 Java 开发人员内部使用的 Java 编译器)。
火龙果被占用了
2007-08-30
打赏
举报
回复
sun.nio.cs.ext 包下有扩展的字符集类,在 %JRE_HOME%/lib/charsets.jar 中
sun.nio.cs 包下有标准的字符集类,在 %JRE_HOME%/lib/rt.jar 中
这些类属于 Java 的运行环境(Java 运行的基础)类库,不能在 JDK API 的帮助中查到。
bit1010
2007-08-30
打赏
举报
回复
这些字符串本身在Java中没有定义常量,但是可以在Java中可以获得当前系统可用的字符集,好项是在CharacterSet类中。
寻找
字符集
常量
源码寻找
字符集
常量
过程 做开发也有很多年了,时常会遇到使用
字符集
的地方,有时候就会想,使用硬编码指定
字符集
也太不专业了,有没有
字符集
的
常量
呢?与
字符集
相关的
类
有一个特别明显的就是Charset,这个
类
就代表
字符集
,我们很少使用它的构造方法来创建
字符集
,它有一些获取Charset实例对象的静态方法,如下: 看方法名也很容易理解其中的含义,于是从这四个静态方法中进入源码查看,找到了一些字符
字符集
相关...
Java中的基本数据
类
型及
类
型转换(
常量
、
字符集
、字符编码Unicode)
文章目录前言一、基本数据
类
型1.基本数据
类
型2.
类
型转换3.
常量
二、
字符集
、字符编码(Unicode)总结 前言 本文主要介绍Java中的
常量
、基本数据
类
型(如int、char、String等),简单介绍
字符集
、字符编码Unicode。 一、基本数据
类
型 1.基本数据
类
型 基本数据
类
型也成为内置数据
类
型,可分为4
类
8种 (1)整型 byte(1字节)、short(2字节)、int(4字节)、long(8字节) 取值范围: byte a = 1; short a1 = 2; int a2 = 3; lo
初学Java基础Day05----转义字符,
常量
,命名规范,Java分支语句
在计算机和电信技术中,一个字符是一个单位的字形、
类
字形单位或符号的基本信息。即一个字符可以是一个中文汉字、一个英文字母、一个阿拉伯数字、一个标点符号等。多个字符的集合。例如GB2312是中国国家标准的简体中文
字符集
,GB2312收录简化汉字(6763个)及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。把
字符集
中的字符编码为(映射)指定集合中的某一对象(例如:比特模式、自然数序列、电脉冲),以便文本在计算机中存储和通过通信网络的传递。
字符
常量
与字符串
常量
文章目录字符
常量
非打印字符字符串
常量
字符数组字符指针 字符
常量
利用char声明 字符
常量
用于储存字母和其它字符,本质上储存的是整数(ASCII
字符集
)而不是字符。 #include<stdio.h> int main() { char a = 'd';//c语言中用单引号括起来的就是字符
常量
。 char b = 0B01100100;//字符以数值形式储存。 printf("%d\n%c", a, b); } 运行结果: 100 d 注意的
问题
C语言将字符
常量
视为int
类
型而非ch
在Java中字符型
常量
占多少个字节
在 Java 中,字符型
常量
占用 2 个字节。 Java 使用 Unicode
字符集
来表示字符,Unicode
字符集
使用 16 位来表示每个字符,所以字符型
常量
在 Java 中占用 2 个字节的存储空间。 例如,下面的代码声明了一个字符型
常量
ch: char ch = 'a'; 在这个例子中,字符型
常量
ch 占用 2 个字节的存储空间。 另外,需要注意的是,Java 中的字符型
常量
是使用...
Java SE
62,630
社区成员
307,264
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章