怎样确定一个16bit的字符是否是中文呢?

firemount 2000-07-19 12:48:00
怎样确定一个文件是否是文本文件?

我这样做了,读取一些字符,转化为unicode,
然后用iswasii确定是否asc字符,
但这对英文文件可以,其中有中文就不行了,

怎样确定一个16bit的字符是否是中文呢?
谢谢!


...全文
320 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
firemount 2000-07-20
  • 打赏
  • 举报
回复
我按“两个字节的的首位都是1”这样做了,
对于不是unicode的文件可以识别了,
但是对于unicode的文本文件,根本不行,
该怎么做呢?
Un1 2000-07-20
  • 打赏
  • 举报
回复
文本文件没有任何文件头,连notepad都不去确认。
firemount 2000-07-20
  • 打赏
  • 举报
回复
可是如果是中英文混排呢?很可能这样。

我的主要问题是不根据文件后缀名想要确定该文件是否是文本文件,
有没有别的什么办法?

谢谢!
ad 2000-07-19
  • 打赏
  • 举报
回复
你不要转化为unicode,直接读就是了,如果读出的字节最高位为1,则可能是半个汉字,继续读入下一字节,然后组成一个汉字。
firemount 2000-07-19
  • 打赏
  • 举报
回复
我试了一下,好象并不是你说的那样,
如“我”是25105,换成二进制是01100010 00010001
“他”是20182,换成二进制是01001110 11010110


zxi666 2000-07-19
  • 打赏
  • 举报
回复
一个中文字符占两个字节,这两个字节的的首位都是1,你可以通过这个方法来判断是否是中文字符。当然,首先是要保证仅仅是中文和英文的混合,如果由其他的文字(比如俄文之类)我就不知道该怎么办了!判断的时候要注意的是,中文都是两个两个字节的,因而你还要判断是否只读了半个中文,这其实很简单,只要你在判断时有一个记数就可以了。

16,467

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧