python爬虫

lauqasim 2016-12-02 09:41:58

我想爬下这种网页http://politics.people.com.cn/n1/2016/1201/c1024-28918749.html的标题和正文，我的代码只能爬标题和加粗的

#-*- coding:utf-8 -*-

import urllib2
from bs4 import BeautifulSoup
import socket
import httplib

html = urllib2.urlopen(r'http://politics.people.com.cn/n1/2016/1201/c1024-28918749.html')

soup = BeautifulSoup(html.read(),"lxml")
#print soup.get_text()
print soup.find("title").text
print soup.find("strong").text
print soup.find('p').text

...全文

1207 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

zdg20042586 2017-04-12

打赏
举报

回复

Python编程确实简单高效...

fuganggangxx 2017-04-03

打赏
举报

回复

谢谢分享，正在努力当爬虫

讲诉python爬虫的20个案例。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源

本课程使用Python3作为编程语言，主要内容包括Python爬虫的基本原理，编写简单的爬虫，使用爬虫从百度下载比基尼美女图片、beautiful soup的详细使用方法，如何使用beautiful soup分析html代码，基于队列的爬虫、...

python爬虫，并将数据进行可视化分析，数据可视化包含饼图、柱状图、漏斗图、词云、另附源代码和报告书。

我们在之前学习过python爬虫的知识，很多小伙伴在学习了爬虫之后都能够使用它去抓取一些网页上的数据了，但是对于一个网站的爬取还是有些问题存在的，所以这一篇文章将会以实际的代码示例来介绍Python爬虫如何实现...

594

社区成员

254,047

社区内容

发帖

与我相关

我的任务

其他技术论坛（原bbs）

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章