php 如何判断为简体中文!!!!

rgmlkthh 2010-06-24 05:17:08
大家好,在php里如果判断一个字符串里含有繁体字呢??有什么办法大家说说哈,谢了先~~~~~
...全文
277 5 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
rgmlkthh 2010-06-25
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 xuzuning 的回复:]
简化字共有 2288 个,全部收录在国标字库(GB2312)中
其内码为:
第一字节 0xb1 ~ 0xfe
第二字节 0xa1 ~ 0xfe

完全可以用正则表达式判断
[/Quote]
用正则表达式????能否具体一点啊,万分感谢....
Dleno 2010-06-24
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 xuzuning 的回复:]
简化字共有 2288 个,全部收录在国标字库(GB2312)中
其内码为:
第一字节 0xb1 ~ 0xfe
第二字节 0xa1 ~ 0xfe

完全可以用正则表达式判断
[/Quote]

又学了老大一招。
rgmlkthh 2010-06-24
  • 打赏
  • 举报
回复
感谢楼上的回答.我写过一个方法当文件保存为gb2312状态时,可以实现判断,但是当我想把文件保存为UTF8,然后再将其转换为gb2312情况下,再判断,这个时候就不太准确了,估计是将utf8转换为gb2312的时候有些问题....

function isGB2312($str) {
$strlen = strlen($str);
for ($i = 0; $i < $strlen; $i ++) {
if (ord(substr($str, $i, 1)) > 0xa0) {
$char = substr($str, $i, 2);
$temp = isGB2312ByChar($char);
$i ++;
if (!$temp)
return false;
}
}
return true;
}

function isGB2312ByChar($code) {
if (strlen($code) == 2 || strlen($code) == 1) {
$code1 = substr($code, 0, 1);
$code2 = substr($code, 1, 1);
// echo '$code1 = ' . ord($code1) . '<br />';
// echo '$code2 = ' . ord($code2) . '<br />';
if (ord($code1) >= 176 && ord($code1) <= 247
&& ord($code2) >= 160 && ord($code2) <= 254)
return 1;
return 0;
} else {
return 0;
}
}

$string = "呵呵";
$flag = isGB2312(mb_convert_encoding($string, "UTF-8", "GB2312"));
文件保存为utf8哈...
xuzuning 2010-06-24
  • 打赏
  • 举报
回复
简化字共有 2288 个,全部收录在国标字库(GB2312)中
其内码为:
第一字节 0xb1 ~ 0xfe
第二字节 0xa1 ~ 0xfe

完全可以用正则表达式判断
rgmlkthh 2010-06-24
  • 打赏
  • 举报
回复
顶一下,utf编码,简体和繁体有交叉,所有不好用正则表达式...

21,893

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧