本课程内容包括,网络爬虫的基础知识、开发网络爬虫涉及的文件操作、网络爬虫常用的库-requests的用法详解、网络爬虫常用的库-BeautifulSoup的用法详解。百度百科词条项目实战过程中,详细讲解了网络爬虫开发的过程,包括:
百度百科-爬虫程序结构设计 模块导入 当前页面的爬取 解析器提取有效数据 解析器提取href属性 解析相关页面管理URL 数据存储
4.9w+
社区成员
8.5w+
社区内容