sqoop1 导入数据 保存成parquet spark dataframe无法使用

zhaochaoqi 2016-07-05 02:41:25
用sqoop1-1.4.5 -as-aprquet 将数据从MySQL 导入到hdfs 保存成parquet 但是spark 无法使用
保存 sqoop保存的文件不是parquet file
...全文
764 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
a95473004 2016-12-28
  • 打赏
  • 举报
回复
Spark的jdbcreader比sqoop好用多了。。。。 放弃sqoop吧。。
zhaochaoqi 2016-11-16
  • 打赏
  • 举报
回复
sqoop import --connect "jdbc:oracle:thin:@host:nettele" --username admin -P admin --split-by CUSTOMER_ID --query 'select * from db.table where createdate is not null and $CONDITIONS ' --target-dir /user/tkonline/test-parquet/ --num-mappers 6 --as-parquetfile
LinkSe7en 2016-07-08
  • 打赏
  • 举报
回复
把sqoop命令贴上来看看

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧