python 如何把中文编码转换为UTF-8的编码

fx397993401 2012-02-10 03:45:19
读取一个文件,然后开始转换编码格式

我写的有错误
from BeautifulSoup import BeautifulSoup          # For processing HTML
import os
import sys
fp = open('2.htm','r')
html = fp.read()
#htmp_utf = unicode(html, "gbk").encode("utf8")
soup = BeautifulSoup(html_utf)
print soup.prettify()


我希望有大大 可以考虑更多的情况 ,当编码不是gbk 或其他编码的时候 写一个完善的函数 来进行转换
...全文
1469 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
iambic 2012-02-10
  • 打赏
  • 举报
回复
这个是一楼的宝典。不管什么问题,不管什么现象,只要和中文有关的,加上之后应该就能解决问题。如果这都不能解决问题,他会来CSDN发帖的。
fx397993401 2012-02-10
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 rabbitlbj 的回复:]

在第一行加上
# encoding:utf-8
[/Quote]
额 这个不行吧
RabbitLBJ 2012-02-10
  • 打赏
  • 举报
回复
在第一行加上
# encoding:utf-8

37,744

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧