社区
脚本语言
帖子详情
Python爬虫的问题(jieba wordcloud)
Shorec
2019-06-24 10:58:48
想要排除13行列出的词汇但试了很多次都不行
...全文
247
2
打赏
收藏
Python爬虫的问题(jieba wordcloud)
想要排除13行列出的词汇但试了很多次都不行
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
一笑程序猴
2019-06-26
打赏
举报
回复
从你的代码上看貌似只对counts字典进行了删除操作,而并没有对words进行删除操作,后面使用的应该用的是words吧。所以最终是没有排除掉的。
考古学家lx(李玺)
2019-06-26
打赏
举报
回复
您这是爬虫问题吗
用
python
结合
jieba
和
word
cloud
实现词云效果
词云,顾名思义就是很多个单词,然后通过出现的频率或者比重之类的标准汇聚成一个云朵的样子嘛,其实呢现在网上已经有很多能自动生成词云的工具了,比如
Word
le,Tagxedo等等,
Python
也能实现这样的效果,我们通过
jieba
库和
word
cloud
库也能十分轻松的完成词云的构建
python
豆瓣电影
爬虫
使用
python
爬豆瓣电影top250,
爬虫
用于从豆瓣电影Top250页面获取电影信息,并进行数据保存、可视化和词频统计。
Python
爬虫
数据可视化分析大作业.zip
Python
爬虫
数据可视化分析大作业,利用
Python
网络
爬虫
对京东商城中指定商品下的用户评论进行爬取,对数据预处理操作后进行文本情感分析并可视化显示。
Python
爬虫
携程成都旅游景点评论 pyecharts 画点画各地游客航线
word
cloud
词云图情感分析 selenium
Python
爬虫
获取携程成都旅游攻略网站 获取景点评论 pyecharts程度地图画点 画各地游客航线 统计 成都民宿航班图柱状图箭头图雷达图 html
jieba
分词
word
cloud
词云图 情感分析 selenium浏览器多页
爬虫
+数据分析+统计图 游客信息行程信息挖掘 jupyter notebook numpy pandas 数据分析 数据挖掘
(源码)基于
Python
爬虫
与数据分析的新闻系统.zip
# 基于
Python
爬虫
与数据分析的新闻系统 ## 项目简介 这是一个基于
Python
的本科毕业设计项目,旨在通过
爬虫
技术爬取新闻数据,并结合自然语言处理和机器学习库处理文本,最后通过前端页面展示处理结果。项目使用
爬虫
技术从今日头条网站爬取新闻数据,并进行情感分析、聚类分析和词频分析等,将处理结果在前端页面展示。 ## 主要特性和功能 1.
爬虫
技术使用
Python
编写
爬虫
,通过API接口或关键词搜索方式获取今日头条的新闻数据。 2. 文本处理利用NLP和
Python
机器学习库处理新闻文本,包括情感分析、文本聚类、词频分析等。 3. 前端展示将处理结果在前端页面展示,如情感分布直方图、词云、标签分布饼图等。 4. 数据库存储将爬取和处理的新闻数据存储到数据库中,便于后续查询和分析。 ## 安装使用步骤 1. 环境准备确保已安装
Python
环境,以及所需的库如requests、BeautifulSoup、
jieba
、
word
cloud
等。
脚本语言
37,743
社区成员
34,211
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章