社区
脚本语言
帖子详情
python 锘� 乱码 该怎么解决
power0811
2010-07-28 10:25:36
读取文件 文件中有 "锘�" 乱码 该怎么过滤掉 用程序 多谢
...全文
1027
8
打赏
收藏
python 锘� 乱码 该怎么解决
读取文件 文件中有 "锘�" 乱码 该怎么过滤掉 用程序 多谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
foolbirdflyfirst
2010-07-30
打赏
举报
回复
你读取的源文件不是utf-8么?
也就是说在utf-8文件中,有些字符串已经是乱码了?
如果是,那没什么好办法啊。
power0811
2010-07-29
打赏
举报
回复
我现在的问题是去除bom了 在读取源文件内容后 要将其转换成gbk编码输出到另一个文件去, 如果文件中有乱码, 我怎么判断出来,如果是中文字, 我可以读三个字节每次, 问题是如果它本身是乱码 我怎么判断呢 还有如果文件中还包含比如gb2312 两个字节长度的编码,我到时候该怎么判断出来读多少个字节 呵呵 多谢指教
iambic
2010-07-28
打赏
举报
回复
基本做不到。如果没有出现解码异常,计算机怎么知道这是乱码?比如我把一个孤单的囧字呈现在你面前,你也很难分辨这是乱码还是常码吧。
关键是乱码从何而来?在文件中的位置有何特征。你要是能给个真实的样本最好了。
power0811
2010-07-28
打赏
举报
回复
文件本身就是utf8编码的 可是我在读取的时候想把文件中的"锘�"乱码去掉 然后做转换处理 该怎么操作呢
iambic
2010-07-28
打赏
举报
回复
有乱码多半是你解码有问题,先把编码搞正确吧。
foolbirdflyfirst
2010-07-28
打赏
举报
回复
utf-8是传输码,是unicode字符集以特定规律转换而成的。
你先不用python读(是不是读出来转了编码了?),以某个可以查看文件16进制的编辑器(ultraedit可以)查看一下文件最开始的三个字节。
既然你说是utf-8文件,前面又带3个古怪字节,估计就是bom了,去除即可,没鸟用,linux就不认,是windows推荐的标准而已
power0811
2010-07-28
打赏
举报
回复
有 \xef\x81\xac 这三个字节 该怎么办呢 有没有utf8编码对照表之类的呢
foolbirdflyfirst
2010-07-28
打赏
举报
回复
这个挺眼熟,貌似utf-8 bom头,如果是去除文件开头的ef bb bf三个字节即可。
python
2.7.5 64位
截止到2013.7.12的最新版,
python
2.7.5的64位版
Python
中文出现
乱码
怎么
解决
?
Python
中出现
乱码
,英文显示没问题,一般是中文输出出现了编码问题,如果
python
文件中没有指定编码,在执行过程中就会出现报错!
Python
中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。
解决
方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 就行了 注意:
Python
3.X 源...
python
输出结果
乱码
_
python
输出结果
乱码
怎么办
Python
中文
乱码
的原因,
Python
中文
乱码
是由于
Python
在解析网页时默认用Unicode去解析,而大多数网站是utf-8格式的,并且解析出来之后,
python
竟然再以Unicode字符格式输出,会与系统编码格式不同,导致中文输出
乱码
,知道原因后我们就好
解决
了。下面上代码#-*-coding:utf-8-*-importurllib2importreimportrequest...
python
中文编码
乱码
问题原理分析及
解决
思路
python
中文编码
乱码
问题原理分析及
解决
思路
Python
爬虫编写
乱码
问题、验证码登录问题和IP代理问题
解决
今天继续给大家介绍
Python
爬虫相关知识,本文主要内容是
Python
爬虫编写
乱码
问题、验证码登录问题和IP代理问题
解决
。 一、
乱码
问题
解决
二、验证码登录问题
解决
三、IP代理问题
解决
脚本语言
37,743
社区成员
34,212
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章