新手--Python爬虫请问一下这个怎么爬取?

huanan0581 2017-10-08 10:02:29

请问一下各位大神,我该怎么获取两个<span>xx</span>........<span>XX</span>获取XX也获取.....中的内容!
谢谢了~
...全文
282 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
lwghost 2017-11-02
  • 打赏
  • 举报
回复
from bs4 import BeautifulSoup import urllib.request def GetURL(url): html=urllib.request.urlopen(url) soup=BeautifulSoup(html) ls=soup.find_all('p') for l in ls: s=l.find_all('span') print(s)
LOWGUN 2017-10-15
  • 打赏
  • 举报
回复
reg = r'<span style="color:#B00815.............>(.*?)" </span>' name = re.findall(reg, html)
暗里着迷0902 2017-10-11
  • 打赏
  • 举报
回复
用scrapy模块,里面用xpath+正则解析就可以了
nageyes 2017-10-09
  • 打赏
  • 举报
回复
学了正则表达式就简单好多呢
qq852053457 2017-10-09
  • 打赏
  • 举报
回复
lxml模块里面有个tail 可以获取节点之后的内容 http://blog.csdn.net/betabin/article/details/24392369

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧