qt 下爬网页中文全是乱码

coder_B 2015-12-11 02:56:39
qt获取网页http://roll.finance.sina.com.cn/s/channel.php?ch#col=89&spec=&type=&ch=&k=&offset_page=0&offset_num=0&num=60&asc=&page=1"的全部信息,中文全是乱码,main函数里
QTextCodec *codec = QTextCodec::codecForName("gb2312");
QTextCodec::setCodecForLocale(codec);
QTextCodec::setCodecForCStrings(codec);
QTextCodec::setCodecForTr(codec);使用过好多种编码格式,但还是乱码,求大神解救
...全文
269 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
赵4老师 2015-12-16
  • 打赏
  • 举报
回复
对电脑而言没有乱码,只有二进制字节;对人脑才有乱码。啊 GBK:0xB0 0xA1,Unicode-16 LE:0x4A 0x55,Unicode-16 BE:0x55 0x4A,UTF-8:0xE5 0x95 0x8A
coder_B 2015-12-16
  • 打赏
  • 举报
回复
也分析过网页的编码的格式,按网页的编码格式改的,但还是乱码
weilin.jiang 2015-12-11
  • 打赏
  • 举报
回复
每个网页都有自己的编码格式的 比如这个贴源代码前面 是这样的
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html class='csdn-bbs'>
  <head>
    <script id="allmobilize" charset="utf-8" src="http://a.yunshipei.com/1327c36bdd7197e30fd9f4b48d1a5bcc/allmobilize.min.js"></script>
从charset看得出编码为utf-8,你应该先分析编码 格式再干其他事

64,646

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧