BeautifulSoup怎么获得带冒号的标签内容?

hanhf 2018-05-23 11:24:57
我现在正在用BeautifulSoup解析RSS的XML文件,主要代码如下:


#!/usr/bin/python
# -*- coding: UTF-8 -*-
import requests
import codecs
from bs4 import BeautifulSoup

url = 'http://www.ifanr.com/feed'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36'}
page = requests.get(url, headers=headers)
page.encoding = 'utf-8'
page_content = page.text
soup = BeautifulSoup(page_content, 'lxml-xml')
items = soup.select('rss > channel > item')
f = codecs.open('d:/ifanr.txt', 'w', 'utf-8')
for i in range(len(items)):
f.write(u'标题:' + items[i].title.text + '\r\n')
f.write(u'内容:' + items[i].description.text + '\r\n')
f.write(u'链接:' + items[i].link.text + '\r\n\r\n')
f.close()


像<title>、<description>、<link>标签都可以用items[i].title的方式访问到,可是有一个标签是<content:encoded>,这就难住了,应该怎么访问?

如果用feedparser也可以考虑,同样的问题是怎么得到<content:encoded>标签中的内容?
...全文
1351 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
Charlie。 2018-06-04
  • 打赏
  • 举报
回复
find_all({'content': 'encoded' })

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧