数据仓库中的merge into 和 delete + insert into
一个数据仓库的应用,每天增量加载到全量表。符合merge into 的要求。
但是考虑merge的update操作会比较慢,于是改成了
delete from table where exists```
insert into
两步操作。
性能反而下降很大。
原来半个小时的脚本,现在上升到3个小时。
每天增量不稳定 2-500万,有两天会比较大,到百万级别,平时都在几十万
全量表数据在1300万左右
问:这是为什么?
应该采取哪种操作?
从现实的检验来看,merge into 的性能要好于第二种方案。