C++怎么保存UTF8网页的内容,而不会出现乱码

qq675927952 2011-01-13 06:46:51

我用爬虫爬的。。
部分代码如下:
char recvBuf [510250];
recvresult= recv(ClientSock, recvBuf, 10240, 0);//接受网络数据,获得的内容会出现乱码,知道网页是UTF8的

接收数据这几步代码应该怎么写,才能正确保存UTF8的页面内容。。。C++语言。。。


求高手,在线等。急啊!!!! 解决了必有重谢!
...全文
193 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
iambic 2011-01-13
  • 打赏
  • 举报
回复
不能用wchar。这就像传文件一样,人家传你一个文件是utf-8,难道你在传输过程中还能把文件编码给改了?而且socket流上就是字节流,人家传什么字节你收什么字节,根本没有编码这么一回事。
qq675927952 2011-01-13
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 iambic 的回复:]
保存成utf-8就行。要说有乱码那是你保存后打开的方式不对。
[/Quote]
你好,想问一下是不是C++写的爬虫 recv只能用char数据接收,不能用wchar数据接收
iambic 2011-01-13
  • 打赏
  • 举报
回复
保存成utf-8就行。要说有乱码那是你保存后打开的方式不对。
qq675927952 2011-01-13
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 jixingzhong 的回复:]
转换编码后保存,参考:
http://www.vckbase.com/document/viewdoc/?id=1397
[/Quote]

您的意思是,我先把char数组保存下来,然后在转换编码吗?
qq675927952 2011-01-13
  • 打赏
  • 举报
回复
我的只能正确接收 英文的页面。。。。。。。
jixingzhong 2011-01-13
  • 打赏
  • 举报
回复
转换编码后保存,参考:
http://www.vckbase.com/document/viewdoc/?id=1397

65,186

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧