[高手注意]VC中分割文件,如何避免将中文分开,请赐代码!(100分)

orrin 2005-03-18 03:23:07
VC中分割文件,文件中有可能混合有中文和英文,也就有可能在分割文件的时候把中文分在两个文件中,如何避免?
...全文
154 14 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
orrin 2005-03-30
  • 打赏
  • 举报
回复
函数IsDBCSLeadByte可以判断一个字节是不是汉字的第一个字节,基本上就用这个思路!
散分!
dirdirdir3 2005-03-24
  • 打赏
  • 举报
回复
就是要判断首字节是否大于0xa0。
老开山 2005-03-24
  • 打赏
  • 举报
回复
如果你的文件只有英文和中文,我想可以用个笨办法:
从要分割的最后一个字节起,循环判断其是否属于英文或符号,若不是,那就上移一个字节,直到找到英文/符号的字节为止,就从那里截断。
140355 2005-03-24
  • 打赏
  • 举报
回复
汉字用0x80及后续的一个字符表示,避免将0x80和其后续字符分开就行了
goodheartppl 2005-03-24
  • 打赏
  • 举报
回复
判断旁边的字符
longj 2005-03-24
  • 打赏
  • 举报
回复
楼上说的是,那就多加一个判断。
m_syb 2005-03-22
  • 打赏
  • 举报
回复
longj(大哥雁) :根据你所说,可能存在以下情况,连续10000个汉字,都是超过127的,那岂不是都不截断,但实际中汉字与汉字之间是可以截断的,然后这种方法不能做到这一点。

既然找到一个汉字的开头了,再增加一个就断开不就OK了吗?
orrin 2005-03-21
  • 打赏
  • 举报
回复
目前仍无好的解决方案!
Mr-Chen 2005-03-18
  • 打赏
  • 举报
回复
也许这个是你需要的:
http://www.ccw.com.cn/cio/research/info/htm2003/20030915_1485T.asp
orrin 2005-03-18
  • 打赏
  • 举报
回复
longj(大哥雁) :根据你所说,可能存在以下情况,连续10000个汉字,都是超过127的,那岂不是都不截断,但实际中汉字与汉字之间是可以截断的,然后这种方法不能做到这一点。
longj 2005-03-18
  • 打赏
  • 举报
回复
应该考虑到大部分双字节(不仅包括中文)的情况这样就万无一失了, 我记得双字节的文字首字节都是超过127的,你判断一个byte的值如果在0-127以内就可以断开;否则就有可能是双字节,就不断开。

还望大家斧正!
orrin 2005-03-18
  • 打赏
  • 举报
回复
robinzsy() ( ),的方法我用过,一个汉字的两个字节都是0xa1-oxfe之间,不能判断是不是首字节。
laiyiling(※陌生人^@^求职中※) ( ) 的方法,我正在尝试。
robinzsy 2005-03-18
  • 打赏
  • 举报
回复
分割的时候判断边境字符,如果字符大于等于0xa1则说明字符是汉字,不能将这个字符和下一个字符分开。
Kudeet 2005-03-18
  • 打赏
  • 举报
回复
http://www.vckbase.com/document/viewdoc/?id=293
参考这个分割方法,分割的时候加个判断,因为一个汉字是两个字节组成,用函数IsDBCSLeadByte可以判断一个字节是不是汉字的第一个字节。

16,548

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • AIGC Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧