这个html的编码怎么确定?没有charset

lioujian47 2008-07-17 03:49:53
地址: http://www.cfi.net.cn/p20080716001458.html
声明:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">

这个是head

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head>
<title id="pageTitle">有色金属:一周市场概况 行业的估值水平-[中财网]</title>
<meta content="False" name="vs_showGrid"/>
<meta content="JavaScript" name="vs_defaultClientScript"/>
<meta content="http://schemas.microsoft.com/intellisense/ie5" name="vs_targetSchema"/>
<base target="_blank"/>


</head
...全文
201 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
lioujian47 2008-07-21
  • 打赏
  • 举报
回复
谢谢
wang154 2008-07-18
  • 打赏
  • 举报
回复
self.__s = s
... def Decode(self):
... CODES = ['utf-8', 'gbk', ] ##可以在此增加字符编码方式
... for code in CODES:
... try:
... self.__s = self.__s.decode(code)
... self.__codetype = code
... break
... except:
... continue
... def Encode(self, codetype):
... self.__s = self.__s.encode(codetype)
... self.__c金山毒霸免费下载odetype = codetype
... def GetStr(self):
... return self.__s
...
>>> m = MyCode(s)
>>> m.Decode()
>>> m.Encode('utf-8')
>>> m.Decode()
>>> m.Encode('gbk')
maplele20 2008-07-18
  • 打赏
  • 举报
回复
你还是用上面的那个封装类吧,这样子代码的健壮性和扩展性都比较好。
lioujian47 2008-07-18
  • 打赏
  • 举报
回复
对了,我还有个相关的问题.
一般来说,header里面的charset和html中的charset会不会有不一样的情况:
比如header里面是charset=utf-8
而html成了charset=gbk?
lioujian47 2008-07-17
  • 打赏
  • 举报
回复
哦,找到header了,谢谢

Connection: close

Date: Thu, 17 Jul 2008 08:19:00 GMT

Server: Microsoft-IIS/6.0

MicrosoftOfficeWebServer: 5.0_Pub

X-Powered-By: ASP.NET

X-AspNet-Version: 2.0.50727

Cache-Control: private

Content-Type: text/html; charset=utf-8

Content-Length: 15045

wx红杉树 2008-07-17
  • 打赏
  • 举报
回复
在没有指定的情况下,一般按web服务器的编码格式,你要想知道还是抓包看看http头吧。
wx红杉树 2008-07-17
  • 打赏
  • 举报
回复
在没有指定的情况下,一般按web服务器的编码格式,你要想知道还是抓包看看http头吧。
maplele20 2008-07-17
  • 打赏
  • 举报
回复
自己封装一个编码类吧

>>> s = urllib.urlopen('http://www.cfi.net.cn/p20080716001458.html ').read()
>>> class MyCode:
... def __init__(self, s):
... self.__codetype = ''
... self.__s = s
... def Decode(self):
... CODES = ['utf-8', 'gbk', ] ##可以在此增加字符编码方式
... for code in CODES:
... try:
... self.__s = self.__s.decode(code)
... self.__codetype = code
... break
... except:
... continue
... def Encode(self, codetype):
... self.__s = self.__s.encode(codetype)
... self.__codetype = codetype
... def GetStr(self):
... return self.__s
...
>>> m = MyCode(s)
>>> m.Decode()
>>> m.Encode('utf-8')
>>> m.Decode()
>>> m.Encode('gbk')
>>> print m.GetStr()

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head>
<title id="pageTitle">有色金属:一周市场概况
iambic 2008-07-17
  • 打赏
  • 举报
回复
看http的header(不是html header)。再不行就猜吧。
​ 博主介绍:✌在职Java研发工程师、专注于程序设计、源码分享、技术交流、专注于Java技术领域和毕业设计✌项目名称基于Web的酒店客房管理系统的设计与实现系统说明3.2.1  用户模块功能分析前台模块应主要包括用户登录模块、用户注册模块、查看客房信息模块、客房预定 模块、用户留言模块、充值模块和个人信息维护模块。用户登录模块:用户通过输入注册的的账号和密码,然后进行身份验证,匹配成功 后实现登录功能。用户注册模块:用户输入合法的账号和密码可以实现注册功能。 查看客房信息模块:用户可以通过首页查看客房的价格,图片,详情等信息,从而   可以选择想要预定的房间。 客房预定模块:用户选择自己想要预定的客房后,可以通过输入相关信息进行订房操作。用户留言模块:用户可以向管理员发送留言。 充值模块:用户可以通过添加银行卡再为自己进行充值操作。 个人信息维护模块:用户可以修改自己的姓名、密码、身份证号等信息,还可以查看自己的订单。3.2.2  管理员模块功能分析对于管理员而言,一个好的管理系统总是能让酒店的管理工作事半功倍[7]。管理员 能够通过这个系统对自己的酒店情况一目了然,应该包括客户留言模块、客房管理模 块、订房信息管理模块、入住信息管理模块、统计分析模块、酒店新闻管理模块、会 员信息管理模块、员工信息管理模块、系统用户管理模块、个人信息维护模块。客户留言模块:管理员可以查看并回复用户的留言。客房管理模块:管理员可以管理客房信息,可以添加新的客房,删除已经停用的客房信息,还可以修改现有的客房信息。订房信息管理模块:管理员可以处理用户的订房请求,为用户办理入住手续。入住信息管理模块:对于没有注册的线下客户,也可以办理入住手续。统计分析模块:可以对酒店所有的入住信息进行记录和总结分析。酒店新闻管理模块:管理员可以更新网站上的新闻公告,展示图片等信息。会员信息管理模块:管理员可以查看到所有的注册会员信息,可以对会员信息进行删除,修改,添加操作。员工信息管理模块:管理员可以查看到自己公司所有的员工信息,而且还可以对员工的相关信息进行管理。系统用户管理模块:管理员可以查看到所有的系统管理员信息并对管理员信息进行管理。个人信息维护模块:管理员可以更改自己的登录密码或者是姓名、性别、手机号等 相关个人信息。​编辑 环境需要1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境:IDEA,Eclipse,Myeclipse都可以。推荐IDEA;3.tomcat环境:Tomcat 7.x,8.x,9.x版本均可4.硬件环境:windows 7/8/10 1G内存以上;或者 Mac OS; 5.数据库:MySql 5.7版本;6.是否Maven项目:否;技术栈1. 后端:Spring+SpringMVC+Mybatis2. 前端:JSP+CSS+JavaScript+jQuery使用说明1. 使用Navicat或者其它工具,在mysql中创建对应名称的数据库,并导入项目的sql文件;2. 使用IDEA/Eclipse/MyEclipse导入项目,Eclipse/MyEclipse导入时,若为maven项目请选择maven;若为maven项目,导入成功后请执行maven clean;maven install命令,然后运行;3. 将项目中springmvc-servlet.xml配置文件中的数据库配置改为自己的配置;4. 运行项目,在浏览器中输入http://localhost:8080/ 登录运行截图​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑​编辑 用户管理控制层:package com.houserss.controller;import javax.servlet.http.HttpSession;import org.apache.commons.lang3.StringUtils;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype.Controller;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RequestMethod;import org.springframework.web.bind.annotation.RequestParam;import org.springframework.web.bind.annotation.ResponseBody;import com.houserss.common.Const;import com.houserss.common.Const.Role;import com.houserss.common.ServerResponse;import com.houserss.pojo.User;import com.houserss.service.IUserService;import com.houserss.service.impl.UserServiceImpl;import com.houserss.util.MD5Util;import com.houserss.util.TimeUtils;import com.houserss.vo.DeleteHouseVo;import com.houserss.vo.PageInfoVo;/** * Created by admin */@Controller@RequestMapping(/user/)public class UserController if (ip != null && ip.length() > 0) String[] ips = ip.split(,);for (int i = 0; i  

37,708

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧