中文和英文字符的长度

bladeinside 2003-03-12 04:06:28

len("测试")的输出值是2，而len("ce")的输出值也是2

现在我想问的是：
在不知道Str是中文还是英文的情况下，有没有这样一种函数或者什么方法Func，使得
如果Str是中文，
Func(Str)=len(Str)*2
如果Str是英文
Func(Str)=len(Str)

...全文

49 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

Cooly 2003-03-12

打赏
举报

哦，我明白你的意思了。

bladeinside 2003-03-12

打赏
举报

我已经搞定了。
查了以前的贴子
lenb(strconv(str,vbfromunicode))

Cooly 2003-03-12

打赏
举报

只能循环判断每个字符

字符数统计中文英文字符分开统计 delphi 源码

工程虽然小，但是能示例一段字符有多少中文多少英文。

js计算字符串长度，可以输入中文、英文、数字、中英文数字混合等，最后计算结果为字符串所占字节个数

c#截取指定长度中英文混合字符串一个中文为两个字符计算，英文一个字符。

<> 一些背景知识: 1. 一个汉字在c\c++的存储, 使用2个字节(char)存储; 2. 汉字存储的第一个char, 其值一定大于'~'(0111 1110=126)，否则将导致识别歧义; 此处, 使用"单ASCII字符"来表示非单ASCII字符的判断，可以根据以下规则(主要R3, R4); : 一个字符串的长度==1，那肯定是一个ASCII字符； : 一个字符串的长度==2，且第1个ASCII字符的编码小于'~'；那肯定是2个单ASCII字符； -- (PS: "") : 一个字符串的长度==3，且中间的ASCII字符的编码小于'~'；那第3个肯定是单ASCII字符； (前2个是否构成1个汉字不能确定) : (基于R3)如果第pos个位置的ASCII字符编码小于'~'，那从下标pos,pos+1处拆分字符串 (下标pos归前串),将不会导致乱码; A 或者 B 的选择，需要知道以下信息： (1). 从 cut_base_pos 开始到 pos_B 结束的这段字符串内，最后一个单ASCII字符的结束下标 p 在此基础上，若使用: y -- 表示单ASCII字符(已确定的)； x -- 表示可能是单ASCII字符，也可能是汉字的半个ASCII存储码；那么一段长度为N的字符串,按照存储的ASCII码可以表示为一串如下的字符串(不包含[]) "x .. x][x .. x y x .. x][x .. x", 其中 s,e表示当前正在分析的一段子串(0<=s长度cut_size) ^ ^ ^ ^ ^ 0 s p e N 在【s, e】之间, 查找结束下标p 的思路: 从e开始向s查找, 找到第一个y 后 break; 记录下标p, 则从位置p开始, 是一个正确的分割(cut); 但此分割并不是一个最好的分割. 可以在位置p上, 再加上 2K 个长度, 使 p+2K 与 pos_B 最接近即可. 可以认为从2K个长度的内容是K个汉字(实际上并不一定..), 但并不影响这个最佳分割的正确性！ :）

VB基础类

7,763

社区成员

197,609

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章