spark进行聚类分析,求知道思路

YS82848866 2018-02-14 04:28:23
用spark对专利数据进行聚类分析,数据是excel表格,求帮忙指导思路。最好能够步骤详细一些,感谢大神
...全文
883 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
见丰 2018-03-19
  • 打赏
  • 举报
回复
excel处理成spark能读取的csv文件,或者把excel数据做到数据库里去,spark读取文件做成dataframe,把要聚类的数据列变换成一个包含vector的列,然后学习这个列

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧