请教一下,想自学大数据,可分析的数据去哪里找呢?

hupo1982 2017-06-03 06:38:08
想自学一下大数据分析,也根据手册自己搭建了Handoop这些的服务器,可现在问题是没有用来分析的数据,互联网公司会有海量的数据,但对于自学者来说,去哪里找能够达到几十G规模的数据呢?
全部自己从网上爬吗,可从互联网上爬几十G的数据这个数据整合和去脏的工作就搞死人吧
想请教一下有没有这方面的公共资源。
...全文
970 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
shiter 2017-06-27
  • 打赏
  • 举报
回复
大数据很大程度上将,数据清洗会占很大一部分
feitianxiaozi 2017-06-26
  • 打赏
  • 举报
回复
哇哦。棒棒哒。学习中。。。。
LinkSe7en 2017-06-13
  • 打赏
  • 举报
回复
爬虫。 我学习大数据,就是写个爬虫爬取新闻站,结果存到HBase里,再通过Spark去进行自然语言分析,结果写到MySQL。 后来再高端点的是爬虫写到Kafka上,然后通过Storm实时进行预处理,写到HBase里,Spark再进行跑批
火山1 2017-06-08
  • 打赏
  • 举报
回复
网络工具抓包 发包

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧