社区
Java SE
帖子详情
急求简体汉字的内码区间(GBK)
GFox
2004-09-03 11:32:18
GB2132的话,是位于GBK/2中,范围是B0A1-F7FE,
还有部分扩展汉字,位于GBK/3(8140-A0FE)、与GBK/4(AA40-FEA0)中,
但是这里面并不是所有都是简体的(还包括有繁体字)。
GBK里整个简体字的内码区间是哪里到哪里呢?
...全文
711
17
打赏
收藏
急求简体汉字的内码区间(GBK)
GB2132的话,是位于GBK/2中,范围是B0A1-F7FE, 还有部分扩展汉字,位于GBK/3(8140-A0FE)、与GBK/4(AA40-FEA0)中, 但是这里面并不是所有都是简体的(还包括有繁体字)。 GBK里整个简体字的内码区间是哪里到哪里呢?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
17 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
runfly2008
2004-10-12
打赏
举报
回复
请大家继续关注!!
GFox
2004-10-08
打赏
举报
回复
GBK编码不是按简繁体进行划分区表的?天啊,那怎么区分繁体简体呢?
ntzls(三星堆)说穷举,但也要事先知道一个字是繁体还是简体才能穷举吧?
也就是你说的:将所有的繁体字、简体字罗列出来一一对应。这个本身就要求“能够罗列出来”,可怎么才能罗列出来呢?
ntzls
2004-09-28
打赏
举报
回复
前段时间看到一个贴子就是将GBK中的繁体转简体在FAQ里(现在找不到了:-<,记得是数据库版块)实现方法就是将所有的繁体字、简体字罗列出来一一对应的。GBK编码不是按简繁体进行划分区表的,所以我知道的方法是穷举。顺便帮顶^_^
GFox
2004-09-28
打赏
举报
回复
不能让它沉了....路过的朋友帮忙up一下...
GFox
2004-09-24
打赏
举报
回复
to flyxxxxx(灭神)
输出所有GBK字符是没有问题,但也不知道哪些是简体的哪些是繁体的呀,有些字我们一眼看得出,有些生辟字,平常不怎么看过的,人工看也不知道是简体还是繁体撒...
GFox
2004-09-24
打赏
举报
回复
to windExtendsRikki(风)
国标 的网站怎么去?
flyxxxxx
2004-09-23
打赏
举报
回复
最笨的方法:
输出从0-66535的所有GBK字符到文件,看它区间是什么
Michael_L_X
2004-09-23
打赏
举报
回复
你去 国标 的网站去看看具体是怎么定义的不就知道了~~
GFox
2004-09-20
打赏
举报
回复
to ntzls(三星堆):
怎么个穷举法?穷举首先就得有繁简体的判定标准才行。
如果有这个判定方法,我又何必穷举?
ntzls
2004-09-16
打赏
举报
回复
穷举呗
GFox
2004-09-16
打赏
举报
回复
自己up一下吧
GFox
2004-09-08
打赏
举报
回复
没有人知道?
poorman1
2004-09-06
打赏
举报
回复
uuuuuuuuuuuuuuuuupppppppppppppppppppppppppppp
gaozhanhai
2004-09-03
打赏
举报
回复
http://chinese.pku.edu.cn/bbs/thread.php?fid=29&tid=10788&action=printable
来这里看看~~
挺全的~~
Lulq21cn
2004-09-03
打赏
举报
回复
GB2312-80 《信息交换用汉字编码字符集》基本集规定一个汉字的内码由两个字节组成。
汉字内码与区位码之间的关系是:
内码第一字节=区码+160
内码第二字节=位码+160
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母
的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。
每个区有94个汉字
GFox
2004-09-03
打赏
举报
回复
简单来说,我想要表示简体汉字的正则表达式
我现在用的是这个
[\u4E00-\u9FA5]
但是这个包括了繁体字
想要一个只是简体字的表达式
GFox
2004-09-03
打赏
举报
回复
GBK代表码(按分类顺序排列)
GBK/1:GB2312非汉字符号A1-A9
B0-B7B8-BF C0-C7C8-CF D0-D7
GBK/2:GB2312汉字
D8-DFE0-E7E8-EFF0-F7
81-8384-87 88-8B8C-8F 90-93
GBK/3:扩充汉字
94-9798-9B 9C-A0
AA-AFB0-B7B8-BFC0-C7C8-CF
GBK/4:扩充汉字
D0-D7D8-DFE0-E7E8-EFF0-F7
F8-FE
GBK/5:扩充非汉字
A8-A9
(1)AA-AF (2)F8-FE
用户自定义区
(3)A1-A7
这个是怎么看的???
【STM32篇】LCD显示
汉字
(从W25Q64中读取
GBK
字库)
文章介绍了如何在STM32F103VET6单片机上,利用外部SPIFlashW25Q64存储
GBK
字库,以解决内部Flash资源不足的问题。通过计算
GBK
字库的偏移地址,从Flash读取字模并显示在LCD屏幕上。详细讲述了
GBK
和GB2312
内码
系统,以及
汉字
显示的步骤和方法。
汉字
内码
扩展规范(
GBK
)
该博客展示了
GBK
汉字
内码
扩展规范编码表,包含
GBK
/1(GB2312非
汉字
符号)、
GBK
/5(扩充非
汉字
)、
GBK
/2(GB2312
汉字
)等分类的编码信息,还给出了相关链接。
计算机
内码
汉字
,
gbk
内码
(
汉字
机
内码
在线查询)
博客内容主要涉及
GBK
编码在高考志愿填报中的应用,帮助考生查询并正确填涂姓名的
GBK
内码
,确保信息准确无误。同时提及了
GBK
编码与ANSI编码的区别,以及字符集转换可能导致的乱码问题。
汉字
编码之
GBK
编码(附完整码表)
本文聚焦
GBK
编码,它是专门为解决
汉字
编码而产生的方案。介绍了
GBK
与UTF - 8的区别,如
GBK
一个
汉字
占两字节,外国人看会乱码;UTF - 8一个
汉字
占三字节,外国人看不乱码。还阐述了
GBK
编码方式,以及
GBK
与GB2312、GB18030、UTF - 8、Unicode的关系。
GBK
汉字
内码
扩展规范编码表(二)
本文介绍了
GBK
汉字
内码
扩展规范的编码表,包括非
汉字
符号、GB2312
汉字
及其扩充字符等内容。该规范详细列出了不同
区间
的字符范围及对应的
汉字
或符号。
Java SE
62,622
社区成员
307,257
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章