社区
VB基础类
帖子详情
中文和英文字符的长度
bladeinside
2003-03-12 04:06:28
len("测试")的输出值是2,而len("ce")的输出值也是2
现在我想问的是:
在不知道Str是中文还是英文的情况下,有没有这样一种函数或者什么方法Func,使得
如果Str是中文,
Func(Str)=len(Str)*2
如果Str是英文
Func(Str)=len(Str)
...全文
49
3
打赏
收藏
中文和英文字符的长度
len("测试")的输出值是2,而len("ce")的输出值也是2 现在我想问的是: 在不知道Str是中文还是英文的情况下,有没有这样一种函数或者什么方法Func,使得 如果Str是中文, Func(Str)=len(Str)*2 如果Str是英文 Func(Str)=len(Str)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Cooly
2003-03-12
打赏
举报
回复
哦,我明白你的意思了。
bladeinside
2003-03-12
打赏
举报
回复
我已经搞定了。
查了以前的贴子
lenb(strconv(str,vbfromunicode))
Cooly
2003-03-12
打赏
举报
回复
只能循环判断每个字符
字符
数统计
中文
英文
字符
分开统计delphi
字符
数统计
中文
英文
字符
分开统计 delphi 源码
计算中
英文
字符
长度
工程虽然小,但是能示例一段
字符
有多少
中文
多少
英文
。
js计算
字符
串
长度
js计算
字符
串
长度
,可以输入
中文
、
英文
、数字、中
英文
数字混合等,最后计算结果为
字符
串所占字节个数
c#截取指定
长度
,中
英文
混合
字符
串
c#截取指定
长度
中
英文
混合
字符
串 一个
中文
为两个
字符
计算,
英文
一个
字符
。
中
英文
字符
串分割算法C++C程序示例
<> 一些背景知识: 1. 一个汉字在c\c++的存储, 使用2个字节(char)存储; 2. 汉字存储的第一个char, 其值一定大于'~'(0111 1110=126),否则将导致识别歧义; 此处, 使用"单ASCII
字符
"来表示非 单ASCII
字符
的判断, 可以根据以下规则(主要R3, R4); : 一个
字符
串的
长度
==1,那肯定是一个ASCII
字符
; : 一个
字符
串的
长度
==2,且第1个ASCII
字符
的编码小于'~'; 那肯定是2个单ASCII
字符
; -- (PS: "") : 一个
字符
串的
长度
==3,且中间的ASCII
字符
的编码小于'~'; 那第3个肯定是单ASCII
字符
; (前2个是否构成1个汉字不能确定) : (基于R3)如果第pos个位置的ASCII
字符
编码小于'~', 那从下标pos,pos+1处拆分
字符
串 (下标pos归前串),将不会导致乱码; A 或者 B 的选择,需要知道以下信息: (1). 从 cut_base_pos 开始到 pos_B 结束的这段
字符
串内, 最后一个单ASCII
字符
的结束下标 p 在此基础上, 若使用: y -- 表示单ASCII
字符
(已确定的); x -- 表示可能是 单ASCII
字符
,也可能是 汉字的半个ASCII存储码; 那么一段
长度
为N的
字符
串,按照存储的ASCII码可以表示为一串如下的
字符
串(不包含[]) "x .. x][x .. x y x .. x][x .. x", 其中 s,e表示当前正在分析的一段子串(0<=s
长度cut_size) ^ ^ ^ ^ ^ 0 s p e N 在 【s, e】 之间, 查找结束下标p 的思路: 从e开始向s查找, 找到 第一个y 后 break; 记录下标p, 则从位置p开始, 是一个正确的分割(cut); 但此分割并不是一个最好的分割. 可以在 位置p上, 再加上 2K 个
长度
, 使 p+2K 与 pos_B 最接近即可. 可以认为从2K个
长度
的内容是K个汉字(实际上并不一定..), 但并不影响这个最佳分割的正确性! :)
VB基础类
7,763
社区成员
197,609
社区内容
发帖
与我相关
我的任务
VB基础类
VB 基础类
复制链接
扫一扫
分享
社区描述
VB 基础类
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章