社区
脚本语言
帖子详情
请问如何识别字符串中的汉字!!急
xjbs
2003-08-19 04:10:22
如题:
“中华人民共和国GB2312标准φ×”
如何识别这一串字符中的汉字与非汉字呢,
我采用分解汉字取ASC码的方式,但最后的两个符号也将被识别为汉字,
有没有其它方式呢?
请高手帮忙啊!
...全文
48
13
打赏
收藏
请问如何识别字符串中的汉字!!急
如题: “中华人民共和国GB2312标准φ×” 如何识别这一串字符中的汉字与非汉字呢, 我采用分解汉字取ASC码的方式,但最后的两个符号也将被识别为汉字, 有没有其它方式呢? 请高手帮忙啊!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
13 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xjbs
2003-09-02
打赏
举报
回复
只能从区位信息中读才最准确,其余的都有不足!
kalven_chan
2003-08-23
打赏
举报
回复
双字节的文字的第一个ascII码都 >128 ,所以见到它,就取两个字节。然后再往下判断
xjbs
2003-08-21
打赏
举报
回复
符号也会认成汉字的,
hexubing
2003-08-21
打赏
举报
回复
up
xingxing
2003-08-21
打赏
举报
回复
取得汉字的ascii,如果大于128就是。
jdsnhan
2003-08-21
打赏
举报
回复
象φ×”这类符号,本身asci值<128,但其不能称为汉字。
但大于128的也不都是汉字,存在乱码,具体的界限偶也说不清。
:(。
qiyousyc
2003-08-20
打赏
举报
回复
asci码>=128的就是汉字。
rogery
2003-08-19
打赏
举报
回复
用asci码来判其是不是一个完整的字
klbt
2003-08-19
打赏
举报
回复
你的分解规则,判断依据是128吗,建议从160开始。
nhdj
2003-08-19
打赏
举报
回复
记得以前在delphi下面做过,可以实现,不知道pb怎么做
polugen
2003-08-19
打赏
举报
回复
1. GB code的内码的两个字节都是从A0H - FEH之间的
2. BIG code 的内码的第一个字节是80H - FFH,第二个字节是00H - FFH
所以,你要浏览全文,看看是否有第二个字节是小于7FH的汉字,如果有的话,一般是BIG code的。当然也有特殊情况,不过非常少见的。
happy_0325
2003-08-19
打赏
举报
回复
ascii()>128,φ×我也不知道了
incats
2003-08-19
打赏
举报
回复
反过来呀. 取0 ~ Z先, 余下再做汉字与否判断
中
文相似度匹配算法
基于音形码的
中
文
字符串
相似度算法 背景介绍
字符串
相似度算法是指通过一定的方法,来计算两个不同
字符串
之间的相似程度。通常会用一个百分比来衡量
字符串
之间的相似程度。
字符串
相似度算法被应用于许多计算场景,在诸如数据清洗,用户输入纠错,推荐系统, 剽窃检测系统,自动评分系统,以及网页搜索和DNA序列匹配这些方向都有着十分广泛的应用。 常见的
字符串
相似度算法包括编辑距离算法(EditDista
ruby查找
字符串
ruby查找
字符串
字符串
的取代 将
字符串
的一部分换成其他的
字符串
的这种操作称为"取代"。Ruby有sub与gsub这两个方法用来做取代的操作,这两个方法的差异在于sub方法是取代最先找到的地方,而gsub方法会取代所有找到的地方。 关于sub方法与gsub方法,请...
java 读取文本 读取每行
字符串
java 读取文本 读取每行
字符串
VB如何只读取
字符串
中
的数字部分??
逐个字符判断,是否为 "+-0123456789."
中
的一个,取出连续的数值部分问题不明确啊 比如: dim s as string dim v as long s="123abc456efg" 如果你只要123,那么有现成的函数: v=val(s) 如果你要123456,如老鸟所言,逐个字符判断,或者用正则 遍历~Private Sub Command1_C...
C++学习day--03
字符串
常量和打印函数、命名空间
C++学习day--03
字符串
常量和打印函数、命名空间
脚本语言
740
社区成员
8,036
社区内容
发帖
与我相关
我的任务
脚本语言
PowerBuilder 脚本语言
复制链接
扫一扫
分享
社区描述
PowerBuilder 脚本语言
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章