社区
脚本语言
帖子详情
python 锘� 乱码 该怎么解决
power0811
2010-07-28 10:25:36
读取文件 文件中有 "锘�" 乱码 该怎么过滤掉 用程序 多谢
...全文
1688
8
打赏
收藏
python 锘� 乱码 该怎么解决
读取文件 文件中有 "锘�" 乱码 该怎么过滤掉 用程序 多谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
foolbirdflyfirst
2010-07-30
打赏
举报
回复
你读取的源文件不是utf-8么?
也就是说在utf-8文件中,有些字符串已经是乱码了?
如果是,那没什么好办法啊。
power0811
2010-07-29
打赏
举报
回复
我现在的问题是去除bom了 在读取源文件内容后 要将其转换成gbk编码输出到另一个文件去, 如果文件中有乱码, 我怎么判断出来,如果是中文字, 我可以读三个字节每次, 问题是如果它本身是乱码 我怎么判断呢 还有如果文件中还包含比如gb2312 两个字节长度的编码,我到时候该怎么判断出来读多少个字节 呵呵 多谢指教
iambic
2010-07-28
打赏
举报
回复
基本做不到。如果没有出现解码异常,计算机怎么知道这是乱码?比如我把一个孤单的囧字呈现在你面前,你也很难分辨这是乱码还是常码吧。
关键是乱码从何而来?在文件中的位置有何特征。你要是能给个真实的样本最好了。
power0811
2010-07-28
打赏
举报
回复
文件本身就是utf8编码的 可是我在读取的时候想把文件中的"锘�"乱码去掉 然后做转换处理 该怎么操作呢
iambic
2010-07-28
打赏
举报
回复
有乱码多半是你解码有问题,先把编码搞正确吧。
foolbirdflyfirst
2010-07-28
打赏
举报
回复
utf-8是传输码,是unicode字符集以特定规律转换而成的。
你先不用python读(是不是读出来转了编码了?),以某个可以查看文件16进制的编辑器(ultraedit可以)查看一下文件最开始的三个字节。
既然你说是utf-8文件,前面又带3个古怪字节,估计就是bom了,去除即可,没鸟用,linux就不认,是windows推荐的标准而已
power0811
2010-07-28
打赏
举报
回复
有 \xef\x81\xac 这三个字节 该怎么办呢 有没有utf8编码对照表之类的呢
foolbirdflyfirst
2010-07-28
打赏
举报
回复
这个挺眼熟,貌似utf-8 bom头,如果是去除文件开头的ef bb bf三个字节即可。
在CSV文件读取时id读取之后成了‘
锘
縤d‘,该怎么修改
准备用
python
实现一个小想法,里边数据可能会有点多,也为了代码能成块展示,所以打算写一个读取文件的函数。此时考虑到
python
中可以直接将CSV格式文件读取成字典的形式,所以尝试了一下。但是中间出现了错误,第一行第一列中是后面数组的’id’号,每次在读取的时候出现’
锘
縤d’就是不按照自己预想的套路来出牌!想到应该是数据保存类型的问题。于是,我准备将他转换成博客中说的不带“BOM”的,但是我。可以看出我的第一行都是准备了字典的键值的,且都是合法的!所以我开始了我的尝试,来
解决
我自己的问题。
python
读取CSV文件显示
锘
縟ate
查了半天,原来用pd.read_csv读取文件的时候,加一个参数encoding=‘utf-8-sig’,就能正常读取了,不再显示
乱码
,这么个小错误耽误了我一天时间.找了半天原因竟然在CSV文件的一个列的名字上,列名我写的date,用excel打开CSV文件也是这么显示的,但读取的时候,在内存中显示date变成了
锘
縟ate,等于变成了
乱码
,结果我所有的代码都失效了.做股票K线,数据保存在CSV文件里,写了一天竟然画不出K线,用网上所有的教程和代码都不行,...
python
爬虫 网页
乱码
问题
解决
方法
在使用
python
爬取网页时,经常会遇到
乱码
问题,一旦遇到
乱码
问题,就很难得到有用的信息。本人遇到
乱码
问题,一般有以下几个方式:1、查看网页源码中的head标签,找到编码方式,例如: 在上图中,可以看到charset='utf-8',说明这个网页很大可能是采用‘UTF-8’编码(是很大可能,但不是百分之百),因此可以试试这个编码方式:result = resp...
python
中——requests爬虫【中文
乱码
】的3种
解决
方法
python
中requests爬虫【中文
乱码
】问题,是最常遇到的问题,对于初学者来说,是很困恼的。本文将详细说明,
python
中使用requests库编写爬虫程序时,出现【中文
乱码
】的原因,及常见3种
解决
办法。
Python
中文画图
乱码
的
解决
方法
在
Python
画图时,我们一般希望在图中添加中文标签或者变量名称,这样可以增强我们图形的可读性,可是在
Python
中有时会出现了
乱码
。 下面举出一个例子说明如何
解决
中文
乱码
的问题。 import pandas...
脚本语言
37,739
社区成员
34,211
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章