python爬虫

lauqasim 2016-12-02 09:41:58
我想爬下这种网页http://politics.people.com.cn/n1/2016/1201/c1024-28918749.html的标题和正文,我的代码只能爬标题和加粗的

#-*- coding:utf-8 -*-

import urllib2
from bs4 import BeautifulSoup
import socket
import httplib

html = urllib2.urlopen(r'http://politics.people.com.cn/n1/2016/1201/c1024-28918749.html')

soup = BeautifulSoup(html.read(),"lxml")
#print soup.get_text()
print soup.find("title").text
print soup.find("strong").text
print soup.find('p').text
...全文
1207 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
zdg20042586 2017-04-12
  • 打赏
  • 举报
回复
Python编程确实简单高效...
fuganggangxx 2017-04-03
  • 打赏
  • 举报
回复
谢谢分享,正在努力当爬虫

594

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧