求思路完成数据库数据处理算法
现在有数据库数据,系统会自动每天生成一个数据文件,就针对某个表做操作就可以了。
数据库表的结构相同。内容如下
文件20120213db.db
------------------ 2012-02-13 ----------------
字段id 字段content
1 START 001
2 AAAAAAAAAAA
3 BBBBBBBBBBB
4 END 001
5 START 002
6 CCCCCCCCCCCC
文件20120214db.db
------------------ 2012-02-14 ------------------
字段id 字段content
1 DDDDDDD
2 END 002
3 START 003
4 EEEEEEE
5 FFFFFFF
6 GGGGGGGG
7 START 004
8 KKKKKKKK
需要用 C#完成怎么将两个文件的数据组合起来
START 和 END 是有效区分一批数据是同一个batch ,实现的结果下。
前提条件是两个数据库的数据记录是海量,需要分段,分块处理。而且不只是一个database file,而是多个可能有一年的数据。
字段id 字段content
001 START 001
001 AAAAAAAAAAA
001 BBBBBBBBBBB
001 END 001
002 START 002
002 CCCCCCCCCCCC
002 DDDDDDD
002 END 002
003 START 003
003 EEEEEEE
003 FFFFFFF
003 GGGGGGGG
004 START 004
004 KKKKKKKK
希望可以有一种好的算法把数据一小块一小块处理。保持数据的完整性和准确性最为关键。假如限定读取数据的行数,应该如何去实现呢?