网址解析出来，显示不正常

qqblack 2017-01-20 11:30:13

为啥新浪的网址，这段代码，显示的是正常的，换一个网址结果就好像是乱码呀？

# -*- coding:utf-8 -*-

##从新浪网爬取新闻

import requests

from bs4 import BeautifulSoup

newsurl='http://news.sina.com.cn/china/'

# newsurl='http://www.city-data.com/city/Honolulu-Hawaii.html' #这个为啥不行，结果是乱码的

res = requests.get(newsurl)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text,'html5lib')

print(res.text)

上面是新浪网的显示结果，是被解析了的
换成http://www.city-data.com/city/Honolulu-Hawaii.html这个网址，解析结果就是乱码的（全是css代码一样的东西）
这样有个什么问题呢？
-----在页面上出现的文字，你在这个解析结果中是搜不到的

这是为什么呀？

我通过开发者工具观察了一下
新浪网的响应（对应chrome中的network-preview)

而另外一个网址是这样的（全是css代码一样的东西）

...全文

215 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

qqblack 2017-01-21

打赏
举报

回复

好吧，其实是我自己大意了，仔细往下翻，还是有源代码的（网页上出现的东西，可以在源代码中搜到）
只不过，没有把具体某个东西提取出来，导致太多，看起来很乱

在网页中，后台传来的json数据中包含html标签，将该json数据绑定到Vue.js中对象中，对该对象进行for循环，发现数据中的html标签不能被解析，而是当作字符显示出来。问题如下所示：解决： Vue.js中提供了v-html...

Windows10系统用户在使用电脑时，偶尔会碰到某些程序/文件/文件夹图标显示不正常的问题。其实，这很可能是系统图标缓存出现错误导致的。该问题早在Win7、Win8、Win8.1系统中就出现过。下面，小编就向大家分享Windows...

在实际应用过程中可能会遇到DNS解析错误的问题，就是说当我们访问一个域名时无法完成将其解析到IP地址的工作，而直接输入网站IP却可以正常访问，这就是因为DNS解析出现故障造成的。这个现象发生的机率比较大，所以...

<...</span> 这是我的项目代码，v-html解析...、’、’'等却显示不出来。后来百度了一下，具体细节可以点击该链接查看详细描述。文章大致的意思是在v-html中某些特殊字符若想显示出来，需要转为实体名称，...

这个是wxparse代码的一个bug,在一些特殊的手机里面，在wxparse/html2json.js中的第112和119行，都有一个console.dir(这个函数的使用，把这个函数注释掉，内容就可以正常显示出来了。...

37,720

社区成员

34,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章