请教一个CROSS APPLY效率的问题

keueng 2018-05-09 06:03:53
(SQL SERVER2016)想问个CROSS APPLY效率的问题.有两张表TABLEA(数据有1万行),TABLEB(数据有40万行).
想在TABLEA表中, 找到各'ID'分组中的'最后的年'与TABLEB中的'SNO'进行关联查询.
想到两种方法达到查询结果,使用CTE的方法只用2秒种, 而使用CROSS APPLY的方法,耗时近2小时. 想问:
1. 为啥CROSS APPLY的效率这么低呢?
2. 有啥办法可以提高 CROSS APPLY的效率吗,毕竟CROSS APPLY看起来更好懂, 代码写的少些.
谢谢!

-- 1. CTE方法
WITH CTEA
AS
(
SELECT *
FROM TABLEA AS A
INNER JOIN TABLEB AS B
ON A.ID = B.SNO
)
, CTEB
AS
(
SELECT *
, MAX(年度) OVER (PARTITION BY ID) AS 最后的年
FROM CTEA
)
SELECT *
, COUNT(*) OVER (PARTITION BY ID) AS NUM
FROM CTEA AS A
WHERE EXISTS
(
SELECT *
FROM CTEB
WHERE A.年度 = 最近年月
AND A.ID = ID
);


-- 2. CROSS APPLY方法
SELECT *
FROM TABLEB AS A
CROSS APPLY
(
SELECT *
FROM TABLEA
WHERE A.SNO = ID
ORDER BY
年度 DESC
OFFSET 0 ROWS FETCH NEXT 1 ROWS ONLY
) AS B
...全文
1020 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
keueng 2018-05-15
  • 打赏
  • 举报
回复
引用 8 楼 zjcxc 的回复:
table scan 没有索引怎么快
引用 5 楼 sinat_28984567 的回复:
--测试数据
if not object_id(N'Tempdb..#TABLEA') is null
	drop table #TABLEA
Go
Create table #TABLEA([姓名] nvarchar(22),[房产号] int,[位置] nvarchar(23))
Insert #TABLEA
select N'张三',520,N'石家庄' union all
select N'张三',710,N'北京' union all
select N'张三',280,N'武汉' union all
select N'李四',750,N'杭州' union all
select N'李四',220,N'上海' union all
select N'王五',310,N'成都'
GO
if not object_id(N'Tempdb..#TABLEB') is null
	drop table #TABLEB
Go
Create table #TABLEB([年度] Date,[姓名] nvarchar(22),[补贴金额] int)
Insert #TABLEB
select '2012',N'张三',50 union all
select '2013',N'张三',70 union all
select '2014',N'张三',80 union all
select '2014',N'李四',70 union all
select '2015',N'李四',90 union all
select '2016',N'李四',20 union all
select '2017',N'王五',30 union all
select '2018',N'王五',50 union all
select '2016',N'赵六',20 union all
select '2017',N'赵六',30 union all
select '2018',N'赵六',50
Go
--测试数据结束
SELECT t.年度,
       t.姓名,
       t.补贴金额,
       #TABLEA.*
FROM #TABLEA
    LEFT JOIN
    (
        SELECT *,
               ROW_NUMBER() OVER (PARTITION BY 姓名 ORDER BY 年度 DESC) rn
        FROM #TABLEB
    ) t
        ON t.姓名 = #TABLEA.姓名
           AND t.rn = 1;
引用 5 楼 sinat_28984567 的回复:
--测试数据
if not object_id(N'Tempdb..#TABLEA') is null
	drop table #TABLEA
Go
Create table #TABLEA([姓名] nvarchar(22),[房产号] int,[位置] nvarchar(23))
Insert #TABLEA
select N'张三',520,N'石家庄' union all
select N'张三',710,N'北京' union all
select N'张三',280,N'武汉' union all
select N'李四',750,N'杭州' union all
select N'李四',220,N'上海' union all
select N'王五',310,N'成都'
GO
if not object_id(N'Tempdb..#TABLEB') is null
	drop table #TABLEB
Go
Create table #TABLEB([年度] Date,[姓名] nvarchar(22),[补贴金额] int)
Insert #TABLEB
select '2012',N'张三',50 union all
select '2013',N'张三',70 union all
select '2014',N'张三',80 union all
select '2014',N'李四',70 union all
select '2015',N'李四',90 union all
select '2016',N'李四',20 union all
select '2017',N'王五',30 union all
select '2018',N'王五',50 union all
select '2016',N'赵六',20 union all
select '2017',N'赵六',30 union all
select '2018',N'赵六',50
Go
--测试数据结束
SELECT t.年度,
       t.姓名,
       t.补贴金额,
       #TABLEA.*
FROM #TABLEA
    LEFT JOIN
    (
        SELECT *,
               ROW_NUMBER() OVER (PARTITION BY 姓名 ORDER BY 年度 DESC) rn
        FROM #TABLEB
    ) t
        ON t.姓名 = #TABLEA.姓名
           AND t.rn = 1;
在两表的关联字段(姓名)建立了非聚集索引, TABLEB的排序字段(年度)建立了聚集索引,执行效率确实产生了质变(从原来的2小时提高到了4分钟),但还是比JOIN 变了很多,看来真不能只看代码的好看和易懂啊.那么,如果是这样的话,CORSS APPLY的使用场景主要是在什么地方呢?(如果都能用各种JOIN来替代的话)
zjcxc 2018-05-10
  • 打赏
  • 举报
回复
table scan 没有索引怎么快
  • 打赏
  • 举报
回复
cross apply 主句 没一行对应的数据 都需要 cross apply 部分作子查询
keueng 2018-05-10
  • 打赏
  • 举报
回复
引用 5 楼 sinat_28984567 的回复:
--测试数据
if not object_id(N'Tempdb..#TABLEA') is null
	drop table #TABLEA
Go
Create table #TABLEA([姓名] nvarchar(22),[房产号] int,[位置] nvarchar(23))
Insert #TABLEA
select N'张三',520,N'石家庄' union all
select N'张三',710,N'北京' union all
select N'张三',280,N'武汉' union all
select N'李四',750,N'杭州' union all
select N'李四',220,N'上海' union all
select N'王五',310,N'成都'
GO
if not object_id(N'Tempdb..#TABLEB') is null
	drop table #TABLEB
Go
Create table #TABLEB([年度] Date,[姓名] nvarchar(22),[补贴金额] int)
Insert #TABLEB
select '2012',N'张三',50 union all
select '2013',N'张三',70 union all
select '2014',N'张三',80 union all
select '2014',N'李四',70 union all
select '2015',N'李四',90 union all
select '2016',N'李四',20 union all
select '2017',N'王五',30 union all
select '2018',N'王五',50 union all
select '2016',N'赵六',20 union all
select '2017',N'赵六',30 union all
select '2018',N'赵六',50
Go
--测试数据结束
SELECT t.年度,
       t.姓名,
       t.补贴金额,
       #TABLEA.*
FROM #TABLEA
    LEFT JOIN
    (
        SELECT *,
               ROW_NUMBER() OVER (PARTITION BY 姓名 ORDER BY 年度 DESC) rn
        FROM #TABLEB
    ) t
        ON t.姓名 = #TABLEA.姓名
           AND t.rn = 1;
谢谢版主,你的方法比我用的CTE又简洁了很多,我更想搞明白 的是,为啥 CROSS APPLY的效率会这么低呢?
二月十六 2018-05-10
  • 打赏
  • 举报
回复
--测试数据
if not object_id(N'Tempdb..#TABLEA') is null
drop table #TABLEA
Go
Create table #TABLEA([姓名] nvarchar(22),[房产号] int,[位置] nvarchar(23))
Insert #TABLEA
select N'张三',520,N'石家庄' union all
select N'张三',710,N'北京' union all
select N'张三',280,N'武汉' union all
select N'李四',750,N'杭州' union all
select N'李四',220,N'上海' union all
select N'王五',310,N'成都'
GO
if not object_id(N'Tempdb..#TABLEB') is null
drop table #TABLEB
Go
Create table #TABLEB([年度] Date,[姓名] nvarchar(22),[补贴金额] int)
Insert #TABLEB
select '2012',N'张三',50 union all
select '2013',N'张三',70 union all
select '2014',N'张三',80 union all
select '2014',N'李四',70 union all
select '2015',N'李四',90 union all
select '2016',N'李四',20 union all
select '2017',N'王五',30 union all
select '2018',N'王五',50 union all
select '2016',N'赵六',20 union all
select '2017',N'赵六',30 union all
select '2018',N'赵六',50
Go
--测试数据结束
SELECT t.年度,
t.姓名,
t.补贴金额,
#TABLEA.*
FROM #TABLEA
LEFT JOIN
(
SELECT *,
ROW_NUMBER() OVER (PARTITION BY 姓名 ORDER BY 年度 DESC) rn
FROM #TABLEB
) t
ON t.姓名 = #TABLEA.姓名
AND t.rn = 1;



keueng 2018-05-10
  • 打赏
  • 举报
回复
引用 2 楼 sinat_28984567 的回复:
1、楼主可以看一下两个语句的执行计划,看看消耗在哪,效率为什么高和低
2、好看远远没有想能来的重要……
3、没太看懂需求,但我觉得楼主这个问题可能还有更简洁高效的写法,楼主可以给出测试数据和对应想要的结果,看看大家有没有更好的方法


因为原表涉及到一个办案调查, 因此把原表名隐了, 各位版主大哥见谅,下面是执行计划.



实际需求就是,有两张表,TABLEA (这个是张实验表,原表数据有40万)与 TABLEB(也是实验表,原表数据1万左右),两张都未建立索引
TABLEA如图:

TABLEB如图:

想要达到的结果是,TABLEA表中,张三自2012至2014年一直享有补贴,但TABLEB中看出他是有房产的(北京, 武汉, 石家庄),想要找出他享受补贴的最后一年(这里是2014年),将TABLEA与TABLEB关联,并查看其房产情况.李四,王五的需求一样(也就是查出TABLEA中每一个人最后一年享受补贴及其对应房产的情况,赵六没有房产就不显示).结果如下:
卖水果的net 2018-05-10
  • 打赏
  • 举报
回复
表结构,索引情况,都说一下。
二月十六 2018-05-09
  • 打赏
  • 举报
回复
1、楼主可以看一下两个语句的执行计划,看看消耗在哪,效率为什么高和低 2、好看远远没有想能来的重要…… 3、没太看懂需求,但我觉得楼主这个问题可能还有更简洁高效的写法,楼主可以给出测试数据和对应想要的结果,看看大家有没有更好的方法
吉普赛的歌 2018-05-09
  • 打赏
  • 举报
回复
贴一下执行计划吧。
本课程是PowerBI系列课程之DAX函数专题讲解,包含以下内容 1.  DAX函数基础知识什么是DAX函数数学函数:ABS、DIVIDE、MOD、RAND、ROUND、FIXED等日期和时间函数: CALENDAR、CALENDARAUTO、MONTH、YEAR、DATE、DT等信息函数:USERNAME、USERPRINCIPALNAME、HASONEFILTER、HASONEVALUE、ISFILTERED、ISCROSSFILTERED、ISINSCOPE、ISBLANK、SELECTEDMEASURE、SELECTEDMEASURENAME等逻辑函数:AND、OR、IF、IFERROR、SWITCH、TRUE、FALSE、COALESCE(官方文档含糊不清-结合实例)等关系函数:CROSSFILTER、RELATED、RELATEDTABLE等筛选器函数:FILTER、CALCULATE、ALL、ALLEXCEPT、ALLSELECTED、EARLIER、KEEPFILTERS、REMOVEFILTERS、SELECTEDVALUE、LOOKUPVALUE等父子函数:PATH、PATHCONTAINS、PATHITEM、PATHLENGTH等统计函数:AVERAGE、COUNT、MAX、MIN、SUM等迭代统计函数:AVERAGEX、COUNTX、MAXX、MINX、SUMX、RANKX等表函数: FILTERS 、ADDCOLUMNS、 SELECTCOLUMNS、 CROSSJOIN、 EXCEPT、 GENERATE、 GROUPBY、 SUMMARIZE、 SUMMARIZECOLUMNS、 TOPN、 TREATAS、 UNION、 VALUES、DISTINCT、DATATABLE、NATUALINNERJOIN、NATRUALLEFTOUTERJOIN等文本函数: EXACT、MID、 FIND、 LEN、 REPT、 LOWER、 UPPER、 UNICHAR等时间智能函数:DATEADD、DATESMTD、FIRSTDATE、LASTDATE、SAMEPERIODLASTYEAR等财务函数:2020.7之后发布的,和Excel中财务函数相似,网页和demo pbix简单介绍其他函数:BLANK、ERROR、IFERROR等 DAX函数初体验:Max、Sum、Divide、if、Values等值函数表函数以及表和列的概念DAX函数术语、语法、运算符DAX运算符和引擎中字母大小写问题DAX编程注释和快捷键DAX与Excel函数的共同点和区别(PPT)DAX、xmSQL与SQL表达式的区别(PPT)DAX函数的自学途径 2.  PowerBI中数据建模知识维度建模关系传递和交叉筛选器方向-理解表关系(1v1, 1vM, Mv1,MvM)两个方向上应用安全筛选器关闭关系自动检测新建计算列新建度量值新建计算表:辅助表(五种方式)、日历表数据类型讲解数据格式控制:%、$、千位分隔符、小数位、日期格式Format函数自定义数据格式Convert函数做数据类型转换解决中文数字单位 万 的显示问题Date和DT函数定义固定日期值显示和隐藏列DAX代码分析器阅读DAX表达式方法:从上至下、由内到外(注意Calculate的计算顺序)调试DAX表达式方法:分布输出或VAR输出3.  DAX函数原理 Vertipaq列式数据库原理理解度量值和计算列理解行上下文和筛选上下文:Calculate示意图行上下文中使用VAR替代EARLIERVAR变量在定义时的上下文中计算VAR变量是采用惰性计算(使用时计算)理解扩展表和RELATED函数理解数据沿袭Lineage 4.  开始感知DAX函数的强大DAX函数实现特殊符号的使用DAX函数实现切片器默认当前月或天DAX函数使切片器默认代表无任何选择DAX函数使切片器仅显示有数据的选项DAX函数使切片器反向筛选和计算DAX函数使切片器之间取并集DAX函数使关系中多端的切片器筛选一端的切片器 DAX函数实现年月共同决定数据排序DAX函数实现动态图表标题DAX函数实现动态图表配色和图标DAX函数实现动态纵坐标DAX函数实现动态横坐标5.  理解重点DAX函数重中之重FILTER 和 CALCULATE和CALCULATETABLE详解调节器REMOVEFILTERS和ALL、ALLEXCEPT函数调节器ALL、ALLSELECTED和ISINSCOPE占比分析调节器AllSELECTED和KEEPFILTERS的比较调节器USERELATIONSHIP激活关系调节器TREATAS动态建立关系调节器CROSSFILTER改变筛选器方向重点之ISFILTERED和ISCROSSFILTERED重点之HASONEVALUE和ISINSCOPE的区别重点之表函数SELECTEDCOLUMNS和ADDCOLUMNS重点之表函数NATUALINNERJOIN和NATRUALLEFTOUTERJOIN重点之表函数FILTERS和VALUES比较重点之VALUES和DISTINCT的区别重点之分组函数SUMMARIZECOLUMNS详解重点之函数LOOKUPVALUE vs RELATED vs VLOOKUP 重点之集合函数UNION、INTERSECT、EXCEPT重点之集合函数CROSSJOIN和GENERATE 笛卡尔积重点之值合并、列合并、表合并CONCATENATEX重点之BLANK行产生的原因和BLANK相关函数重点之COALESCE函数处理空重点之FIRSTNOBLANK和FIRSTNOBLANKVALUE函数重点之使用VAR变量表中的列重点之Error和IfError函数6.  实际案例-日期时间和时间智能相关关键点-日期表和事实表关联问题时间智能-同比环比分析时间智能-累计聚合、滚动聚合、移动平均时间智能-期初期末库存分析日期分析-计算任意所选月份的环比日期分析-周的同比环比和周聚合日期分析-指定月份的同比环比和季度环比日期分析-计算季末或季末月份的数据日期分析-趋势图中根据最近月份取TopN日期分析-动态指定某个日期区间分析日期分析-动态任意区间段做数据对比日期分析-实现两个日期列的范围筛选日期分析-按工作日计算日期差日期分析-计算最近两次购买日期差日期分析-根据历史数据做销售预测日期时间函数和时间智能函数使用总结7.  实际案例-DAX函数进阶进阶-解决列排序对计算的影响进阶-实现切片器筛选之间的OR逻辑进阶-矩阵Matrix中高亮显示最大值最小值进阶-DAX列转行 vs 矩阵列转行和逆透视进阶-非日期类型的累计聚合进阶-排名逻辑的4种实现-RANKX详解进阶-分组内排名的实现和理解迭代函数进阶-TopN/BottomN和Others的实现进阶-TopN中实现动态指标进阶-TopN中实现N的动态进阶-分组内动态TopN和Others 进阶-商品折上折-迭代函数SUMX详解 进阶-分析客户购买行为进阶-找出无购买行为的客户进阶-客户购买商品关联度分析 进阶-新客户分析进阶-流失客户分析进阶-回流客户分析进阶-客户购买频次和区间分析进阶-RFM客户价值分析进阶-帕累托分析进阶-盈亏平衡分析报表性能优化思路(PPT)  

22,209

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 疑难问题
社区管理员
  • 疑难问题社区
  • 尘觉
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧