PHP如何获取一个字符串的UTF-8编码

thrive_li 2010-06-07 03:01:41
如体,比如我输入一个“您好”得到它的UTF8编码“\u60a8\u597d”
...全文
808 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
thrive_li 2010-06-07
  • 打赏
  • 举报
回复
感谢2位高手的帮助!!!!结贴!!
thrive_li 2010-06-07
  • 打赏
  • 举报
回复
ok,问题搞定了!
tabris17 2010-06-07
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 thrive_li 的回复:]
第一个问题我明白了,谢谢赐教,第二个问题没明白,unpack返回的数据就是已经把空格都去掉了,怎么让它不去掉呢?标点符号问题先不考虑
[/Quote]

没明白,啥叫吧空格去掉了?
foreach(unpack(
'n*',
mb_convert_encoding(' 你 好 ', 'unicode', 'utf-8')
) as $i) {
echo '\u',dechex($i);
}
输出 \u20\u4f60\u20\u597d\u20
空格就是\u20,这里没用0补齐,其实应该是\u0020
你用printf('\\u%04X', $i);就行了呗
foolbirdflyfirst 2010-06-07
  • 打赏
  • 举报
回复
echo preg_replace('#[\x{4e00}-\x{9fa5}]#ue','chinese_unicode("\\0")',"您好,中国");//保证"您好,中国"是utf-8。
function chinese_unicode($c) {
return "\u".dechex(((ord($c[0]) & 0x1f) << 12) + (ord($c[1]) & 0x3f << 6) + (ord($c[2]) & 0x3f));
}
foolbirdflyfirst 2010-06-07
  • 打赏
  • 举报
回复
也可以根据utf-8 unicode的转换方法
中文即是
1110xxx 10xxxxxx 10xxxxxx
把utf-8中文的前三个字符的1110,10,10去掉即是unicode码。


echo preg_replace('#[\x{4e00}-\x{9fa5}]#ue','chinese_unicode("\\0")',"您好,中国");//保证"您好,中国"是utf-8。
function chinese_unicode($c) {
return "\u".dechex(((ord($c[0]) & 0x1f) << 12) + (ord($c[1]) & 0x3f << 6) + (ord($c[2]) & 0x3f));

}
thrive_li 2010-06-07
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 tabris17 的回复:]

参看php手册

pack() format characters Code Description
a NUL-padded string
A SPACE-padded string
h Hex string, low nibble first
H Hex string, high nibble first
c signed char
C unsigned char……
[/Quote]

第一个问题我明白了,谢谢赐教,第二个问题没明白,unpack返回的数据就是已经把空格都去掉了,怎么让它不去掉呢?标点符号问题先不考虑
tabris17 2010-06-07
  • 打赏
  • 举报
回复
参看php手册

pack() format characters Code Description
a NUL-padded string
A SPACE-padded string
h Hex string, low nibble first
H Hex string, high nibble first
c signed char
C unsigned char
s signed short (always 16 bit, machine byte order)
S unsigned short (always 16 bit, machine byte order)
n unsigned short (always 16 bit, big endian byte order)
v unsigned short (always 16 bit, little endian byte order)
i signed integer (machine dependent size and byte order)
I unsigned integer (machine dependent size and byte order)
l signed long (always 32 bit, machine byte order)
L unsigned long (always 32 bit, machine byte order)
N unsigned long (always 32 bit, big endian byte order)
V unsigned long (always 32 bit, little endian byte order)
f float (machine dependent size and representation)
d double (machine dependent size and representation)
x NUL byte
X Back up one byte
@ NUL-fill to absolute position

n*就是表示将字符串解析为一组以big endian字节顺序保存的16位的无符号整形

其次的问题,把要处理字符串挑出来处理后再拼接
thrive_li 2010-06-07
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 tabris17 的回复:]

foreach(unpack('n*',mb_convert_encoding('你好', 'unicode', 'gbk')) as $i) {
echo '\u',dechex($i);
}

另,你这里的“\u60a8\u597d”其实是unicode编码,而不是utf-8编码
[/Quote]

谢谢这位兄弟,果真是高手啊,我公司的工作了7,8年的人都没搞定这个问题呵呵。
另外再请教几个问题
首先‘n*’是什么意思?
其次我需要将一篇文章都转换为utf-8编码,比如“你好 ,同学!”要生成 “\u4f60\u597d, \u540c\u5b66!”的样式。而你的程序把空格给去除掉了,标点符号也转换出来了,请问我该如何实现呢?可以先不考虑标点符号的问题,但空格不能去除!兄弟能否加我qq:70917176交流交流?


tabris17 2010-06-07
  • 打赏
  • 举报
回复
foreach(unpack(
'n*',
mb_convert_encoding('你好', 'unicode', 'gbk')
) as $i) {
echo '\u',dechex($i);
}

另,你这里的“\u60a8\u597d”其实是unicode编码,而不是utf-8编码
lukylfm 2010-06-07
  • 打赏
  • 举报
回复
我也很想知道
代码转载自:https://pan.quark.cn/s/8ce4326d996e 对于在 CentOS 7 系统中修改网卡配置文件后无法使设置生效的情况,经过实践验证,可以通过使用 nmcli 命令来进行调整。完成修改之后,需要重新启动虚拟机以使更改生效,这样操作流程即告完成。如果设置仍然无法生效,则表明虚拟机在启动过程中所获取的 IP 地址配置并非针对 eth0,此时可以对其它网卡的配置文件进行修改或将其移除。在 CentOS 7 系统中,网络配置的管理机制与早期版本存在差异,主要体现为采用了 Network Manager 服务来负责网络接口的管理。在某些情形下,尽管修改了 `/etc/sysconfig/network-scripts` 目录下的 `ifcfg-eth0` 文件,但网络配置却未能即时生效。此类问题的发生通常源于 CentOS 7 采用了不同于以往的配置读取方法。接下来将具体阐述如何借助 nmcli 命令来处理这一挑战。 以 root 用户身份登录系统并打开终端界面。nmcli 是 Network Manager 提供的命令行界面工具,它支持在命令行环境下执行网络连接的建立、编辑、查询及管理任务。针对修改 eth0 网卡配置的需求,可以遵循以下步骤进行操作: 1. 导航至 `/etc/sysconfig/network-scripts` 目录: ``` cd /etc/sysconfig/network-scripts ``` 2. 检查该目录内是否存在 `ifcfg-eth0.bak` 文件,该备份文件可能是先前调整配置时遗留下来的,若存在可能造成冲突。若发现该文件,可以选择将其删除: ``` [root@localhost netw...
代码转载自:https://pan.quark.cn/s/46fd08fb879c 网管教程 从入门到精通软件篇 ★一。★详尽的xp修复控制台指令及其应用!!! 放入xp(2000)的光盘,安装时选择R,执行修复! Windows XP(涵盖 Windows 2000)的控制台指令是在系统遭遇某些意外状况时的一种极具效用的诊断、检测以及恢复系统功能的工具。笔者确实一直期望能够将这方面的指令进行归纳,此次由老范辛苦整理了这份极具价值的秘籍。 Bootcfg bootcfg 命令用于启动配置与故障恢复(对大多数计算机而言,即 boot.ini 文件)。 带有特定参数的 bootcfg 命令仅在运用故障恢复控制台时方可使用。能够在命令行界面下运用带有不同参数的 bootcfg 命令。 用法: bootcfg /default 设定默认引导选项。 bootcfg /add 向引导清单中增添 Windows 安装。 bootcfg /rebuild 重复整个 Windows 安装流程并让用户选择需添加的项目。 注意:运用 bootcfg /rebuild 之前,应先借助 bootcfg /copy 命令备份 boot.ini 文件。 bootcfg /scan 探查用于 Windows 安装的全部磁盘并展示结果。 注意:这些结果被静态存储,并用于当前会话。若在当前会话期间磁盘配置发生变动,为获取更新的探查结果,必须先重启计算机,然后再次探查磁盘。 bootcfg /list 列示引导清单中已有的项目。 bootcfg /disableredirect 在启动引导程序中禁用重定向。 bootcfg /redirect [ PortBaudRrate] |[ useBio...

21,889

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧