[征文] 一个实际的大数据分析例子

SoftwareTeacher
《编程之美》作者
领域专家: 产品设计技术领域
2022-12-19 08:10:50

CSDN 上已经有很多关于 *爬*虫* 的博客和代码,还有很多关于 情感分析 的研究和实战例子,既然大家对这个技术都这么感兴趣,我们就来一个真实的例子,看看大家在解决实际问题的能力如何。 CSDN 的很多用户都在各个微信群、社区里面表达过对 CSDN 的各种反馈,这些人和众多普通用户相比,还是很少的一部分,那么,我们怎样收集到散落在网上的各种反馈和评论,并做定性、定量的分析呢? 这就需要数据挖掘、自然语言处理、情感分析、和数据可视化的技巧了。 

要求

爬取社交网络(只要最大的那个网站就好)最近N 年用户对CSDN 的评价(语义,情感分析,得到 “正面/负面”),做出一个可视化的报告。

这是一些例子,大家可以自己手动搜索到很多。 当然,用大数据挖掘的技术,会更有效率。 

CSDN 帮助了用户,但是总的结果并不是非常正面:

 

用户明确地表达了对 CSDN 对正面情感

 

 

 

用户表达了对 CSDN 负面的观感

 

 

 

奖励标准:

对于每一篇博客, 我们看:

1)准确度,能准确判断是正面或负面的评价。

2)覆盖度,过去 N 年尽可能多的数据。

3)文章,代码,分析的质量。例如,给出了每月的评价数量,正面/负面的维度了么?有年同比的数据么? 例如:今年 10 月和去年 10 月相比,如何?

4)加分项:把代码签入到 gitcode.net 

我们会奖励技术含量高、分析客观、准确率和覆盖度都很高的 N 个博客奖励。

 

奖品最高是高档csdn 背包。😄 奖品的详情可以看这个帖子: https://bbs.csdn.net/topics/605693411 

怎么投稿?

请直接在这个帖子的评论区加上你的博客的链接,同时加一个 “评论红包”,金额不限。 如果你还没有尝试过,那请看这个帖子的评论区的投稿+评论红包的例子:https://bbs.csdn.net/topics/609601920 

投稿时间:2022/12/20 - 2023/1/10. 

 

(注:写博客的时候,不要直接写 *爬*虫*, 直接写 “大数据挖掘”, “情感分析” 就好)

 

...全文
2058 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复

16,573

社区成员

发帖
与我相关
我的任务
社区描述
CSDN 官方活动专区,欢迎加入
其他 其他
社区管理员
  • 活动助手
  • CSDN学习
  • 我是阿萌
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

试试用AI创作助手写篇文章吧