怎么识别中文?

chatstone 2001-02-15 08:58:00
本人在编文档时,要能够调入中文文档,而识别中文与英文不同,二进制代码不同,请问
各位大虾怎么做?感激不尽!
...全文
91 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
skt642 2001-05-31
  • 打赏
  • 举报
回复
78709关注!
「已注销」 2001-02-15
  • 打赏
  • 举报
回复
汉字是由两个字符组成的,而且根据不同的编号有不同的范围,
GB Language Code Page:(以前用的大陆简体)
Range : A1A1 - F7FE
High Byte : A1 - F7
Low Byte : A1 - FE

BIG5 Language Code Page:(台湾繁体)
Range : A140 - F9FE
High Byte : A1 - F9
Low Byte : 40 - 7E, 80 - FE

GBK Language Code Page:(PWIN9X、PWIN2K用的,兼容GB)
Range : 8140 - FEFE
High Byte : 81 - FE
Low Byte : 40 - 7E, 80 - FE
hide 2001-02-15
  • 打赏
  • 举报
回复
在GB码里面
一级汉字和二级汉字的内码是又范围的。
识别中文和英文最简单的方法是检查最高位是否为1。
例如:你随便拿到一个字节,判断最高为是否是1,如果是1肯定不是英文。当然全角的英文的最高位置也是1。但是全角小写a 的内码是0xe1a3, 全角小写A的内码是0xc1a3.剩下的就不用我说了吧?
沒有名字 2001-02-15
  • 打赏
  • 举报
回复
一个中文字符由两个unsigned char构成,GB中文,第一个字符大于0x80,第二个大于0x20
可根据这个特征判断
coldarcher 2001-02-15
  • 打赏
  • 举报
回复
将GB2312改为E文

16,472

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧