社区
基础编程
帖子详情
怎么将未知编码文本转换为UTF-8
ustbleetom
2010-08-08 11:24:32
服务器端用php中读取一个文本文件内容,发送给客户端,需要发送UTF-8编码,但是读取的内容的编码不知道。需要先判断文本的编码格式吗?怎么判断?
使用 mb_convert_encoding($text, 'UTF-8','GB2312,UTF-8');这样对GB和UTF-8的没问题,但是其他编码可能还有问题。
另外php手册中有人这样用: iconv('', 'UTF-8', $str); 但是我试了不行。。
有什么比较简单的方法吗?大家指点一下。
...全文
361
6
打赏
收藏
怎么将未知编码文本转换为UTF-8
服务器端用php中读取一个文本文件内容,发送给客户端,需要发送UTF-8编码,但是读取的内容的编码不知道。需要先判断文本的编码格式吗?怎么判断? 使用 mb_convert_encoding($text, 'UTF-8','GB2312,UTF-8');这样对GB和UTF-8的没问题,但是其他编码可能还有问题。 另外php手册中有人这样用: iconv('', 'UTF-8', $str); 但是我试了不行。。 有什么比较简单的方法吗?大家指点一下。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
ustbleetom
2010-08-09
打赏
举报
回复
[Quote=引用 3 楼 jlzan1314 的回复:]
试试看这个
http://hi.baidu.com/jlzan1314/blog/item/8f602b7fb35024330dd7da34.html
我这里只支持2个编码,可以再改一下程序.
[/Quote]
你这个好像跟 mb_convert_encoding($text, 'UTF-8','GB2312,UTF-8') 的效果是一样的
jlzan1314
2010-08-09
打赏
举报
回复
试试看这个
http://hi.baidu.com/jlzan1314/blog/item/8f602b7fb35024330dd7da34.html
我这里只支持2个编码,可以再改一下程序.
ustbleetom
2010-08-09
打赏
举报
回复
[Quote=引用 5 楼 helloyou0 的回复:]
既然编码未知,你如何判断转换出的结果是对是错?
[/Quote]
看到有人通过文件头判断原来的编码,但是我觉得php应该可以实现这个功能。
helloyou0
2010-08-09
打赏
举报
回复
既然编码未知,你如何判断转换出的结果是对是错?
ErikChen1985
2010-08-08
打赏
举报
回复
不知道原编码是什么,能转吗?学习中...
ustbleetom
2010-08-08
打赏
举报
回复
另外各种文件编码 在PHP中的表示方式是什么?
CharsetAssistant:集
编码
查询,文件
编码
转换
,
未知
编码
检测等于一体的小工具。支持几十种
编码
,使用VC6构建
查询
UTF-8
编码
: 查询UTF-16LE (Unicode)
编码
: 查询汉字区位码: 查询五笔字型码:
编码
转换
支持
转换
单个文件或整个文件夹
编码
检测 支持检测单个文件或十六进制
编码
序列 十六进制查看 编译方法 本程序使用 VC6 ...
linux将usascii转化为utf8,强制
编码
从US-ASCII到
UTF-8
(iconv)(Force encode from US-ASCII to
UTF-8
(iconv))...
强制
编码
从US-ASCII到
UTF-8
(iconv)(Force encode from US-ASCII to
UTF-8
(iconv))我正在尝试将一堆文件从US-ASCII转码为
UTF-8
。为此,我使用iconv:iconv -f US-ASCII -t
UTF-8
file.php > file-utf8.phpThing是...
C++系列第2:C++2.0(11+14+17+20)详解及多线程实战
66 允许用圆括弧的值进行聚合初始化 67 unicode字符串字面量 68 允许
转换
成
未知
边界的数组 68 likely和unlikely 69 第5章 C++2.0(11/14/17/20)总结与分析 70 5.1 C语言与C++ 71 5.2 语言可用性的强化 72 5.2.1 常量 ...
字符
编码
:GBK、GB2312、
UTF-8
原文链接一、各
编码
间的区别
UTF-8
:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节
编码
,它对英文使用8位(即一个字节),中文使用24为(三个字节)来
编码
。
UTF-8
...
C#编写汉字
转换
GB2312--
UTF-8
窗体应用程序,进行汉字
编码
【代码】C#编写汉字
转换
GB2312--
UTF-8
窗体应用程序,进行汉字
编码
。
基础编程
21,886
社区成员
140,364
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章