请问如何识别字符串中的汉字！！急

xjbs 2003-08-19 04:10:22

如题：
“中华人民共和国GB2312标准φ×”
如何识别这一串字符中的汉字与非汉字呢，
我采用分解汉字取ASC码的方式，但最后的两个符号也将被识别为汉字，
有没有其它方式呢？

请高手帮忙啊！

...全文

48 13 打赏收藏转发到动态举报

写回复

用AI写文章

13 条回复

切换为时间正序

请发表友善的回复…

发表回复

xjbs 2003-09-02

打赏
举报

只能从区位信息中读才最准确，其余的都有不足！

kalven_chan 2003-08-23

打赏
举报

双字节的文字的第一个ascII码都 >128 ，所以见到它，就取两个字节。然后再往下判断

xjbs 2003-08-21

打赏
举报

符号也会认成汉字的，

hexubing 2003-08-21

打赏
举报

xingxing 2003-08-21

打赏
举报

取得汉字的ascii,如果大于128就是。

jdsnhan 2003-08-21

打赏
举报

象φ×”这类符号，本身asci值<128,但其不能称为汉字。
但大于128的也不都是汉字，存在乱码，具体的界限偶也说不清。
:(。

qiyousyc 2003-08-20

打赏
举报

asci码>=128的就是汉字。

rogery 2003-08-19

打赏
举报

用asci码来判其是不是一个完整的字

klbt 2003-08-19

打赏
举报

你的分解规则，判断依据是128吗，建议从160开始。

nhdj 2003-08-19

打赏
举报

记得以前在delphi下面做过，可以实现，不知道pb怎么做

polugen 2003-08-19

打赏
举报

1. GB code的内码的两个字节都是从A0H - FEH之间的
2. BIG code 的内码的第一个字节是80H - FFH，第二个字节是00H - FFH
所以，你要浏览全文，看看是否有第二个字节是小于7FH的汉字，如果有的话，一般是BIG code的。当然也有特殊情况，不过非常少见的。

happy_0325 2003-08-19

打赏
举报

ascii()>128,φ×我也不知道了

incats 2003-08-19

打赏
举报

反过来呀. 取0 ~ Z先, 余下再做汉字与否判断

基于音形码的中文字符串相似度算法背景介绍 字符串相似度算法是指通过一定的方法，来计算两个不同字符串之间的相似程度。通常会用一个百分比来衡量字符串之间的相似程度。字符串相似度算法被应用于许多计算场景，在诸如数据清洗，用户输入纠错，推荐系统，剽窃检测系统，自动评分系统，以及网页搜索和DNA序列匹配这些方向都有着十分广泛的应用。常见的字符串相似度算法包括编辑距离算法（EditDista

ruby查找字符串 字符串的取代将字符串的一部分换成其他的字符串的这种操作称为"取代"。Ruby有sub与gsub这两个方法用来做取代的操作，这两个方法的差异在于sub方法是取代最先找到的地方，而gsub方法会取代所有找到的地方。关于sub方法与gsub方法，请...

java 读取文本读取每行字符串

逐个字符判断，是否为 "+-0123456789." 中的一个，取出连续的数值部分问题不明确啊比如： dim s as string dim v as long s="123abc456efg" 如果你只要123，那么有现成的函数： v=val(s) 如果你要123456,如老鸟所言，逐个字符判断，或者用正则遍历~Private Sub Command1_C...

C++学习day--03 字符串常量和打印函数、命名空间

脚本语言

740

社区成员

8,036

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章