社区
Java SE
帖子详情
急求简体汉字的内码区间(GBK)
GFox
2004-09-03 11:32:18
GB2132的话,是位于GBK/2中,范围是B0A1-F7FE,
还有部分扩展汉字,位于GBK/3(8140-A0FE)、与GBK/4(AA40-FEA0)中,
但是这里面并不是所有都是简体的(还包括有繁体字)。
GBK里整个简体字的内码区间是哪里到哪里呢?
...全文
680
17
打赏
收藏
急求简体汉字的内码区间(GBK)
GB2132的话,是位于GBK/2中,范围是B0A1-F7FE, 还有部分扩展汉字,位于GBK/3(8140-A0FE)、与GBK/4(AA40-FEA0)中, 但是这里面并不是所有都是简体的(还包括有繁体字)。 GBK里整个简体字的内码区间是哪里到哪里呢?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
17 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
runfly2008
2004-10-12
打赏
举报
回复
请大家继续关注!!
GFox
2004-10-08
打赏
举报
回复
GBK编码不是按简繁体进行划分区表的?天啊,那怎么区分繁体简体呢?
ntzls(三星堆)说穷举,但也要事先知道一个字是繁体还是简体才能穷举吧?
也就是你说的:将所有的繁体字、简体字罗列出来一一对应。这个本身就要求“能够罗列出来”,可怎么才能罗列出来呢?
ntzls
2004-09-28
打赏
举报
回复
前段时间看到一个贴子就是将GBK中的繁体转简体在FAQ里(现在找不到了:-<,记得是数据库版块)实现方法就是将所有的繁体字、简体字罗列出来一一对应的。GBK编码不是按简繁体进行划分区表的,所以我知道的方法是穷举。顺便帮顶^_^
GFox
2004-09-28
打赏
举报
回复
不能让它沉了....路过的朋友帮忙up一下...
GFox
2004-09-24
打赏
举报
回复
to flyxxxxx(灭神)
输出所有GBK字符是没有问题,但也不知道哪些是简体的哪些是繁体的呀,有些字我们一眼看得出,有些生辟字,平常不怎么看过的,人工看也不知道是简体还是繁体撒...
GFox
2004-09-24
打赏
举报
回复
to windExtendsRikki(风)
国标 的网站怎么去?
flyxxxxx
2004-09-23
打赏
举报
回复
最笨的方法:
输出从0-66535的所有GBK字符到文件,看它区间是什么
Michael_L_X
2004-09-23
打赏
举报
回复
你去 国标 的网站去看看具体是怎么定义的不就知道了~~
GFox
2004-09-20
打赏
举报
回复
to ntzls(三星堆):
怎么个穷举法?穷举首先就得有繁简体的判定标准才行。
如果有这个判定方法,我又何必穷举?
ntzls
2004-09-16
打赏
举报
回复
穷举呗
GFox
2004-09-16
打赏
举报
回复
自己up一下吧
GFox
2004-09-08
打赏
举报
回复
没有人知道?
poorman1
2004-09-06
打赏
举报
回复
uuuuuuuuuuuuuuuuupppppppppppppppppppppppppppp
gaozhanhai
2004-09-03
打赏
举报
回复
http://chinese.pku.edu.cn/bbs/thread.php?fid=29&tid=10788&action=printable
来这里看看~~
挺全的~~
Lulq21cn
2004-09-03
打赏
举报
回复
GB2312-80 《信息交换用汉字编码字符集》基本集规定一个汉字的内码由两个字节组成。
汉字内码与区位码之间的关系是:
内码第一字节=区码+160
内码第二字节=位码+160
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母
的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。
每个区有94个汉字
GFox
2004-09-03
打赏
举报
回复
简单来说,我想要表示简体汉字的正则表达式
我现在用的是这个
[\u4E00-\u9FA5]
但是这个包括了繁体字
想要一个只是简体字的表达式
GFox
2004-09-03
打赏
举报
回复
GBK代表码(按分类顺序排列)
GBK/1:GB2312非汉字符号A1-A9
B0-B7B8-BF C0-C7C8-CF D0-D7
GBK/2:GB2312汉字
D8-DFE0-E7E8-EFF0-F7
81-8384-87 88-8B8C-8F 90-93
GBK/3:扩充汉字
94-9798-9B 9C-A0
AA-AFB0-B7B8-BFC0-C7C8-CF
GBK/4:扩充汉字
D0-D7D8-DFE0-E7E8-EFF0-F7
F8-FE
GBK/5:扩充非汉字
A8-A9
(1)AA-AF (2)F8-FE
用户自定义区
(3)A1-A7
这个是怎么看的???
汉字
与
GBK
内码
互转工具(支持批量转换)
总结起来,
汉字
与
GBK
内码
的互转是中文信息处理中的关键技术之一。通过理解其转换原理,我们可以更好地应对涉及
汉字
编码的各种挑战。而提供的"
汉字
与
GBK
内码
互转工具"则为这一过程提供了便捷的手段,使得编码转换不再...
信息技术标准化技术委员会
汉字
内码
扩展规范(
GBK
).pdf
### 信息技术标准化技术委员会
汉字
内码
扩展规范(
GBK
) #### 概述 《信息技术标准化技术委员会
汉字
内码
扩展规范(
GBK
)》是中国信息技术标准化技术委员会制定的一项国家标准,旨在解决GB2312标准中
汉字
数量不足的...
汉字
ASCII表
汉字
内码
(
GBK
)
总结来说,
汉字
ASCII表和
汉字
内码
(如GB2312和
GBK
)是中文信息处理的关键,它们定义了
汉字
在计算机中的存储和表示方式,使得计算机可以识别、处理和显示大量的
汉字
。在进行跨平台或者网络通信时,理解和掌握这些编码...
GBK
_
汉字
内码
扩展规范编码表
GBK
编码是中国大陆地区广泛使用的一种
汉字
编码标准,它在GB2312的基础上扩展了字符集,不仅包含了
简体
中文
汉字
,还加入了繁体字、日韩文字以及各种标点符号、特殊符号等,极大地提高了编码的兼容性和实用性。...
汉字
内码
查询器
汉字
内码
查询器
汉字
内码
查询器
对于
汉字
而言,常见的
内码
有GB2312、
GBK
、Big5(主要应用于繁体字)以及Unicode等。GB2312是中国大陆最早的标准
汉字
编码,它包含了6763个常用
汉字
。
GBK
是在GB2312基础上扩展的,支持更多的
汉字
和符号。Unicode则是一...
Java SE
62,634
社区成员
307,269
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章