python 锘� 乱码该怎么解决

power0811 2010-07-28 10:25:36

读取文件文件中有 "锘�" 乱码该怎么过滤掉用程序多谢

...全文

1688 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

foolbirdflyfirst 2010-07-30

打赏
举报

回复

你读取的源文件不是utf-8么？
也就是说在utf-8文件中，有些字符串已经是乱码了?
如果是，那没什么好办法啊。

power0811 2010-07-29

打赏
举报

回复

我现在的问题是去除bom了在读取源文件内容后要将其转换成gbk编码输出到另一个文件去, 如果文件中有乱码, 我怎么判断出来,如果是中文字, 我可以读三个字节每次, 问题是如果它本身是乱码我怎么判断呢还有如果文件中还包含比如gb2312 两个字节长度的编码,我到时候该怎么判断出来读多少个字节呵呵多谢指教

iambic 2010-07-28

打赏
举报

回复

基本做不到。如果没有出现解码异常，计算机怎么知道这是乱码？比如我把一个孤单的囧字呈现在你面前，你也很难分辨这是乱码还是常码吧。
关键是乱码从何而来？在文件中的位置有何特征。你要是能给个真实的样本最好了。

power0811 2010-07-28

打赏
举报

回复

文件本身就是utf8编码的可是我在读取的时候想把文件中的"锘�"乱码去掉然后做转换处理该怎么操作呢

iambic 2010-07-28

打赏
举报

回复

有乱码多半是你解码有问题，先把编码搞正确吧。

foolbirdflyfirst 2010-07-28

打赏
举报

回复

utf-8是传输码，是unicode字符集以特定规律转换而成的。
你先不用python读(是不是读出来转了编码了？)，以某个可以查看文件16进制的编辑器(ultraedit可以)查看一下文件最开始的三个字节。
既然你说是utf-8文件，前面又带3个古怪字节，估计就是bom了，去除即可，没鸟用，linux就不认，是windows推荐的标准而已

power0811 2010-07-28

打赏
举报

回复

有 \xef\x81\xac 这三个字节该怎么办呢有没有utf8编码对照表之类的呢

foolbirdflyfirst 2010-07-28

打赏
举报

回复

这个挺眼熟，貌似utf-8 bom头，如果是去除文件开头的ef bb bf三个字节即可。

准备用python实现一个小想法，里边数据可能会有点多，也为了代码能成块展示，所以打算写一个读取文件的函数。此时考虑到python中可以直接将CSV格式文件读取成字典的形式，所以尝试了一下。但是中间出现了错误，第一行第一列中是后面数组的’id’号，每次在读取的时候出现’锘縤d’就是不按照自己预想的套路来出牌！想到应该是数据保存类型的问题。于是，我准备将他转换成博客中说的不带“BOM”的，但是我。可以看出我的第一行都是准备了字典的键值的，且都是合法的！所以我开始了我的尝试，来解决我自己的问题。

查了半天,原来用pd.read_csv读取文件的时候,加一个参数encoding=‘utf-8-sig’,就能正常读取了,不再显示乱码,这么个小错误耽误了我一天时间.找了半天原因竟然在CSV文件的一个列的名字上,列名我写的date,用excel打开CSV文件也是这么显示的,但读取的时候,在内存中显示date变成了锘縟ate,等于变成了乱码,结果我所有的代码都失效了.做股票K线,数据保存在CSV文件里,写了一天竟然画不出K线,用网上所有的教程和代码都不行,...

在使用python爬取网页时，经常会遇到乱码问题，一旦遇到乱码问题，就很难得到有用的信息。本人遇到乱码问题，一般有以下几个方式：1、查看网页源码中的head标签，找到编码方式，例如：在上图中，可以看到charset='utf-8',说明这个网页很大可能是采用‘UTF-8’编码（是很大可能，但不是百分之百），因此可以试试这个编码方式：result = resp...

python中requests爬虫【中文乱码】问题，是最常遇到的问题，对于初学者来说，是很困恼的。本文将详细说明，python中使用requests库编写爬虫程序时，出现【中文乱码】的原因，及常见3种解决办法。

在Python画图时，我们一般希望在图中添加中文标签或者变量名称，这样可以增强我们图形的可读性，可是在Python中有时会出现了乱码。下面举出一个例子说明如何解决中文乱码的问题。 import pandas...

37,739

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章