我用requests模块爬取豆瓣top250 出现乱码

qq_41281195 2020-06-24 10:05:33
我用requests模块爬取豆瓣top250 出现乱码 我看网页的编码方式也是utf-8 我设置的也是utf-8 为什么还会乱码呢我用requests模块爬取豆瓣top250 出现乱码 我看网页的编码方式也是utf-8 我设置的也是utf-8 为什么还会乱码呢




...全文
851 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_29891169 2020-10-06
  • 打赏
  • 举报
回复 3
我也遇到到过了这个问题,我把请求头中只保留"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36" 这一项,就输出正常了。
qq_45470310 2020-07-06
  • 打赏
  • 举报
回复
你的输出端是不是utf-8编码?
  • 打赏
  • 举报
回复
为什么我没有乱码
import requests

url='https://movie.douban.com/top250?start=0&filter='
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3756.400 QQBrowser/10.5.4039.400'}
response=requests.get(url=url,headers=headers)
print(response.text)
运行结果:
  • 打赏
  • 举报
回复
window电脑gbk
xujibicool 2020-06-26
  • 打赏
  • 举报
回复
response.apparent_encoding#查看网页编码 你这个应该是自己终端编码 设置的问题,是linux终端?
chuifengde 2020-06-24
  • 打赏
  • 举报
回复
是不是乱码要看你的代码源文件,网页源文件,response设置,print输出控制台是不是都是统一编码

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧