项目中大数据量插入,您是如何做的。
工作几年了,长进不大。在项目中总遇到这样的情况。
刚开始工作:
两个数据库,将一个库中的数据插入到另外一个库中。(肯定不能在数据库操作,因为有业务逻辑。)我就通过SQL先到一个库查询得到DataSet,再循环这个DataSet插入到另外一个库中。数据量不大几百条吧,速度还可以。总想优化下,但不知道啥合适的方案。
现在工作中:
比以前难度加大。同样是两个数据源,同样不能数据库同步。因为一个是webService获取的XML.我先将XML变成实体类。然后在查本地数据库,查询结果是同样的实体类。这实体类有个主键。
然后我就循环、嵌套循环。判断本地库中是否有不存在的XML中的数据。取出结果后。
我再循环插入数据库,天啊。。百万条数据,插入好慢啊。开多个线程效果也不是特别明显。
加入您在项目中遇到这种情况您会怎么处理呢?
谢谢