字库相关的东东,请高手解决问题!

xh0001 2002-10-18 12:17:41
加精
GB13000字库转换成UNICODE编码,供手机使用。该怎么办?

GB13000是从国家买来的。
...全文
70 29 打赏 收藏 转发到动态 举报
写回复
用AI写文章
29 条回复
切换为时间正序
请发表友善的回复…
发表回复
xh0001 2003-04-28
  • 打赏
  • 举报
回复
谢谢了!
xh0001 2003-03-27
  • 打赏
  • 举报
回复
还是不很明白,我是不是很笨?^_^

我这儿有字库文件,是点阵字库,没有任何码表,只此一个文件。那我该按如何步骤做?

MultiByteToWideChar仅仅是码表转换而已,可是我没有GBK码表,你说自己做GBK码表,我怎么知道每个字在GBK码表的码值?按什么顺序加到该文件?

tiddy 2003-03-27
  • 打赏
  • 举报
回复
比如说8140是GBK中的第一个汉字,你可以这样做GBK的码表文件:
8140 8141 8142 ... ...FEFE
当然,其中有些码位是不必要的,你可以把它们剔除,这个随你。

文件(称A)做好后,用MultiByteToWideChar转换后生成另一个文件(称B),这个即是转换程序需要用到的文件。

现在如果你拿到一个GBK汉字内码是8141,你知道它是文件A中的第二个字,因此你可以取出文件B中的第三和第四个字节,组合而成的内码为此汉字对应的Unicode编码。

这就是内码转换的原理,其实只要理解这个原理,就没什么难的了。
tiddy 2003-03-26
  • 打赏
  • 举报
回复
GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。具体包括:
  1. GB 2312 中的全部汉字、非汉字符号。
  2. GB 13000.1 中的其他 CJK 汉字。以上合计 20902 个 GB 化汉字。
  3. 《简化字总表》中未收入 GB 13000.1 的 52 个汉字。
  4. 《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。
  5. 13 个汉字结构符。
  6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。
  7. GB 12345 增补的 6 个拼音符号。
  8. 汉字“○”。
  9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。
  10. 从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。
  11. GB 13000.1 收入的 31 个 IBM OS/2 专用符号。

GBK 采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。

自己做一个文件,里面写入全部的GBK字符,再借用windows的MultiByteToWideChar将其转换,即得到了GBK到Unicode的码表文件,明白我的意思吧。我就是这么做的。
OldKitty 2003-03-25
  • 打赏
  • 举报
回复
自己做映射表比较费劲,想一想几万个字啊,幸亏别人帮我们做好了,去ftp.unicode.org去找吧。
xh0001 2003-03-25
  • 打赏
  • 举报
回复
怎么做呢?
tiddy 2003-03-24
  • 打赏
  • 举报
回复
那个码表就是所有GBK字符到Unicode字符的一个映射表,是我自己做成的,你直接用就可以了。
当然你也可以自己做一个,:)
xh0001 2003-03-21
  • 打赏
  • 举报
回复
发到那个邮箱了,我没收着呀,发到xh0001@163.net好不好?
tiddy 2003-03-21
  • 打赏
  • 举报
回复
真是很强悍,这个贴子可以支持这么久。
GBK与Unicode互相转换的源代码已发给你,请查收。
非常高兴大家可以一起交流。
xh0001 2003-03-21
  • 打赏
  • 举报
回复
谢谢,我收到了!可是还是不很懂,我买的是字库,没有码表,怎么办?
tiddy 2003-03-21
  • 打赏
  • 举报
回复
我又发了一遍,请查收!
xh0001 2003-03-17
  • 打赏
  • 举报
回复
这个还真不知道,我们的字库是从国家部门买的,而且不能自己转换,否则,一经查出来,我们的产品就会很麻烦。所以我们就只能用标准的字库。

我去试一试二楼的程序看看。谢谢!
OldKitty 2003-03-15
  • 打赏
  • 举报
回复
去www.unicode.org找UNICODE到GB13000的映射表。不知你的GB13000的字库是什么格式的?
xh0001 2003-03-15
  • 打赏
  • 举报
回复
GB13000
OldKitty 2003-03-15
  • 打赏
  • 举报
回复
象TTF,BDF,PCF,原始点阵等等。TTF比较合算,你可以转换成很多尺寸,而且基本上都比较漂亮。
柯本 2003-03-15
  • 打赏
  • 举报
回复
CSDN上有个vb的程序,试试
http://www.csdn.net/cnshare/soft/openfile.asp?kind=1&id=11704
xh0001 2003-03-15
  • 打赏
  • 举报
回复
都有什么格式?
shiqizheng 2003-02-14
  • 打赏
  • 举报
回复
具体你用的是哪种的GB?
xh0001 2003-02-14
  • 打赏
  • 举报
回复
是呀,该怎么办?
shiqizheng 2003-01-22
  • 打赏
  • 举报
回复
字库应该是通用的吧,只不过是编码不同而已,
你的意思是不是把gb码转换为unicode???
加载更多回复(9)

3,846

社区成员

发帖
与我相关
我的任务
社区描述
硬件/嵌入开发 无线
社区管理员
  • 无线
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧