社区
Hadoop生态社区
帖子详情
hive关于distinct的源码具体在哪个位置?
resin_404
2017-12-25 03:09:20
想看看hive中关于distinct 关键字的源码是怎样实现的,还请大神给说明一下具体在哪个包下哪个类?
...全文
453
2
打赏
收藏
hive关于distinct的源码具体在哪个位置?
想看看hive中关于distinct 关键字的源码是怎样实现的,还请大神给说明一下具体在哪个包下哪个类?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
resin_404
2017-12-27
打赏
举报
回复
哥。。lib下只有一个readme 文件!
shiter
2017-12-25
打赏
举报
回复
我猜在lib下面
hive
底层模块实现-
distinct
准备数据语句SELECT COUNT, COUNT(
DISTINCT
uid) FROM logs GROUP BY COUNT;
hive
> SELECT * FROM logs; OK a 苹果 3 ...b 烧鸡 3
hive
> SELECT COUNT, COUNT(
DISTINCT
uid) FROM logs GROUP BY COUNT;根据
hive
源码
阅读笔录
hive
源码
大数据技术之-
Hive
源码
可以知道我们执行HQL主要依赖于和两种脚本来实现提交HQL,而在这两个脚本中,最终启动的JAVA进程的主类为”org.apache.hadoop.
hive
.cli.CliDriver“,所以其实
hive
程序的入口就是CliDriver类。下载
hive
3.1.2版本。.....
Hive
源码
阅读--导读
前者在CliDriver类中流转,后者主要在Driver与ParseDriver类,核心编译在BaseSemanticAnalyzer和QueryPlan类中。 任务的提交与返回 调用顺序: main --(程序的开始)–> run --(任务的开始,读取用户传参与相关...
Hive
-【group by】深刻理解,以及数据倾斜、与
distinct
区别(去重统计)
Hive
【group by】深刻理解
Hadoop生态社区
20,810
社区成员
4,691
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章