BeautifulSoup怎么获得带冒号的标签内容？

hanhf 2018-05-23 11:24:57

我现在正在用BeautifulSoup解析RSS的XML文件，主要代码如下：



#!/usr/bin/python

# -*- coding: UTF-8 -*-

import requests

import codecs

from bs4 import BeautifulSoup



url = 'http://www.ifanr.com/feed'

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36'}

page = requests.get(url, headers=headers)

page.encoding = 'utf-8'

page_content = page.text

soup = BeautifulSoup(page_content, 'lxml-xml')

items = soup.select('rss > channel > item')

f = codecs.open('d:/ifanr.txt', 'w', 'utf-8')

for i in range(len(items)):

    f.write(u'标题：' + items[i].title.text + '\r\n')

    f.write(u'内容：' + items[i].description.text + '\r\n')

    f.write(u'链接：' + items[i].link.text + '\r\n\r\n')

f.close()

像<title>、<description>、<link>标签都可以用items[i].title的方式访问到，可是有一个标签是<content:encoded>，这就难住了，应该怎么访问？

如果用feedparser也可以考虑，同样的问题是怎么得到<content:encoded>标签中的内容？

...全文

1406 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

Charlie。 2018-06-04

打赏
举报

回复

find_all({'content': 'encoded' })

输入HTML: apple peach cucumber 所需的输出:所有div元素正好在下面.我正在尝试div使用CSS选择器找到父级:div[style="display: flex"]这会引发错误:>>> soup.select('div[style="display: flex"]')Traceback (most recent call last):File "",...

BeautifulSoup库的安装首先我们使用 win+R 输入 cmd回车打开终端，切盘（切到自己安装python的盘，切盘f: 切盘语句用盘符加上冒号:）输入安装语句pip Install BeautifulSoup4回车等待即可引入库使用import引入，引入bs4 from bs4 import BeautifulSoup import bs4 解析网页使用resq...

BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单所以不需要多少代码就可以写出一个完整的应用程序。BeautifulSoup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。你不需要考虑编码方式，除非文档没有指定一个编码方式，此时BeautifulSoup就不能自动识...

Beatifulsoup 库使用

有些网站的内容是通过JavaScript动态加载的，这种情况下，仅使用requests和BeautifulSoup可能无法获取完整的内容。抓取到的数据可以存储在本地文件（如CSV、JSON）或者数据库（如SQLite、MySQL）中。使用requests库的get方法发送HTTP请求，获取网页内容。根据实际需求，从解析后的HTML内容中提取所需信息。在你的Python代码中，需要导入requests和BeautifulSoup库。遍历提取到的新闻标题和正文，并输出到控制台或文件。

37,739

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章