社区
Hadoop生态社区
帖子详情
在hive中如正确寻找分位点
houyafan
2017-08-03 12:36:34
问题:
name count value
A 1 1
B 1 2
C 10 3
有这样一个表,存了三条数据,count表示实际中商品的件数。value是价格。
我想找中位数 按理来说应该中位点在C商品中。
但是在hive中使用percentile_approx函数,它会告诉我中位点是B商品 ,请问我应该如何找到正确的中位点
数据量比较大,有3亿条数据
...全文
1178
2
打赏
收藏
在hive中如正确寻找分位点
问题: name count value A 1 1 B 1 2 C 10 3 有这样一个表,存了三条数据,count表示实际中商品的件数。value是价格。 我想找中位数 按理来说应该中位点在C商品中。 但是在hive中使用percentile_approx函数,它会告诉我中位点是B商品 ,请问我应该如何找到正确的中位点 数据量比较大,有3亿条数据
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
houyafan
2017-08-11
打赏
举报
回复
不明白你说的是指什么样的前景
houyafan
2017-08-11
打赏
举报
回复
这个问题已经解决了
Hive
SQL--使用
hive
计算中位数以及
分
位数
开门见山的说,
hive
中有两个函数percentile和percentile_approx,可以用来计算
分
位数。 而中位数即2
分
位数,那么同样可以使用该函数计算。具体使用方如下: percentile:percentile(col, p) col是要计算的列(值必须...
hive
sql计算
分
位数
在观察数据的大致
分
布时,
分
位数是个常用的统计值,下面介绍在
hive
sql中计算
分
位数的语法
hive
sql中计算
分
位数的函数:PERCENTILE_APPROX(适用于大数据量) 使用格式: -- 以数组形式返回多个百
分
位近似计算...
【
Hive
】计算
分
位数
hive
中有两个函数可以用来计算
分
位数:percentile和percentile_approx 具体使用方如下: (1)percentile:percentile(col, p) col是要计算的列(值必须为int类型),p的取值为0-1,若为0.5,那么就是2
分
位数,...
hive
窗口函数+
分
位数
original_id, stage
hive
计算千
分
位数: percentile函数和percentile_approx函数: (percentile要求输入的字段必须是int类型的,而percentile_approx则是数值类似型的都可以 ) 其使用方式为percentile(col, p)、...
【presto &
hive
对比3】
分
位点
提取
--
hive
select '20210202' as log_date, percentile_approx(prob,array(0.25,0.5,0.75,0.95),9999) from ai.push_recsys_open_status_pred_buvid where log_date='20210202'; --presto select '20210202' as log_...
Hadoop生态社区
20,808
社区成员
4,690
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章