Python爬虫的问题(jieba wordcloud)

Shorec 2019-06-24 10:58:48

想要排除13行列出的词汇但试了很多次都不行

...全文

247 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

一笑程序猴 2019-06-26

打赏
举报

回复

从你的代码上看貌似只对counts字典进行了删除操作，而并没有对words进行删除操作，后面使用的应该用的是words吧。所以最终是没有排除掉的。

考古学家lx(李玺) 2019-06-26

打赏
举报

回复

您这是爬虫问题吗

词云，顾名思义就是很多个单词，然后通过出现的频率或者比重之类的标准汇聚成一个云朵的样子嘛，其实呢现在网上已经有很多能自动生成词云的工具了，比如Wordle,Tagxedo等等，Python也能实现这样的效果，我们通过jieba库和wordcloud库也能十分轻松的完成词云的构建

使用python爬豆瓣电影top250，爬虫用于从豆瓣电影Top250页面获取电影信息，并进行数据保存、可视化和词频统计。

Python爬虫数据可视化分析大作业，利用Python网络爬虫对京东商城中指定商品下的用户评论进行爬取，对数据预处理操作后进行文本情感分析并可视化显示。

Python爬虫获取携程成都旅游攻略网站获取景点评论 pyecharts程度地图画点画各地游客航线统计成都民宿航班图柱状图箭头图雷达图 html jieba分词 wordcloud词云图情感分析 selenium浏览器多页爬虫+数据分析+统计图游客信息行程信息挖掘 jupyter notebook numpy pandas 数据分析数据挖掘

# 基于Python爬虫与数据分析的新闻系统 ## 项目简介这是一个基于Python的本科毕业设计项目，旨在通过爬虫技术爬取新闻数据，并结合自然语言处理和机器学习库处理文本，最后通过前端页面展示处理结果。项目使用爬虫技术从今日头条网站爬取新闻数据，并进行情感分析、聚类分析和词频分析等，将处理结果在前端页面展示。 ## 主要特性和功能 1. 爬虫技术使用Python编写爬虫，通过API接口或关键词搜索方式获取今日头条的新闻数据。 2. 文本处理利用NLP和Python机器学习库处理新闻文本，包括情感分析、文本聚类、词频分析等。 3. 前端展示将处理结果在前端页面展示，如情感分布直方图、词云、标签分布饼图等。 4. 数据库存储将爬取和处理的新闻数据存储到数据库中，便于后续查询和分析。 ## 安装使用步骤 1. 环境准备确保已安装Python环境，以及所需的库如requests、BeautifulSoup、jieba、wordcloud等。

37,743

社区成员

34,211

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章