16,142
社区成员
CSDN 上已经有很多关于 *爬*虫* 的博客和代码,还有很多关于 情感分析 的研究和实战例子,既然大家对这个技术都这么感兴趣,我们就来一个真实的例子,看看大家在解决实际问题的能力如何。 CSDN 的很多用户都在各个微信群、社区里面表达过对 CSDN 的各种反馈,这些人和众多普通用户相比,还是很少的一部分,那么,我们怎样收集到散落在网上的各种反馈和评论,并做定性、定量的分析呢? 这就需要数据挖掘、自然语言处理、情感分析、和数据可视化的技巧了。
爬取社交网络(只要最大的那个网站就好)最近N 年用户对CSDN 的评价(语义,情感分析,得到 “正面/负面”),做出一个可视化的报告。
这是一些例子,大家可以自己手动搜索到很多。 当然,用大数据挖掘的技术,会更有效率。
对于每一篇博客, 我们看:
1)准确度,能准确判断是正面或负面的评价。
2)覆盖度,过去 N 年尽可能多的数据。
3)文章,代码,分析的质量。例如,给出了每月的评价数量,正面/负面的维度了么?有年同比的数据么? 例如:今年 10 月和去年 10 月相比,如何?
4)加分项:把代码签入到 gitcode.net
我们会奖励技术含量高、分析客观、准确率和覆盖度都很高的 N 个博客奖励。
奖品最高是高档csdn 背包。😄 奖品的详情可以看这个帖子: https://bbs.csdn.net/topics/605693411
请直接在这个帖子的评论区加上你的博客的链接,同时加一个 “评论红包”,金额不限。 如果你还没有尝试过,那请看这个帖子的评论区的投稿+评论红包的例子:https://bbs.csdn.net/topics/609601920
投稿时间:2022/12/20 - 2023/1/10.
(注:写博客的时候,不要直接写 *爬*虫*, 直接写 “大数据挖掘”, “情感分析” 就好)
全面准确地分析 CSDN 在用户中的口碑。
数据库链接给我(lll¬ω¬)
你让我们扒你自己的数据?我从未听过如此特别的要求
今年我基本就一个评论语句:【大佬的文章非常棒,希望今年能为【1亿技术人】贡献更多力量。红目香薰·留】
题目不错
真牛 一个包 就刑
虽然不打算参与,但是这次活动选题还真不错诶,CSDN各种负面正面的评价都很多,能借力打力证明自己、和热点相符真好。【路过留下感慨】