如何查处重复的数据,如下表所示
Rubi 2006-06-13 02:46:50 表:A
f3
=======
1598750
1598751
1598752
1598753
1598754
1598755
1598756
1598757
1598758
1598759
1599999
13009090
13009091
13009092
13009093
13009094
13009095
13009096
13009097
13009098
13009099
15999990
19999999
有如上表,目前有两个事情要做:
1:对于
13009090
13009091
13009092
13009093
13009094
13009095
13009096
13009097
13009098
13009099
这样连续的10个8位数据,我可以认为他们就是相当于一个7位的1300909,这个规律大家应该可以看得比较清楚.问题是我表中有很多这样的数据,我如何把它转换变成如下的表数据(只有大于7位,目前暂时定位8位的数据才需要转换为7位数据):
那么上面的表A转换后就变成了
表B
f3
=======
1598750
1598751
1598752
1598753
1598754
1598755
1598756
1598757
1598758
1598759
1599999
1300909
15999990-----因为这里只有一个8位数,无法实现转换
19999999-----同上
2,我要找出表中重复的数据,并去掉该重复数据.
规则就是如果一个8位数据不能转换为7位数据,同时该8位数的前7位和该表中的7位数据中任意数据只要一样,那么我就认为该8位数据在表中重复,那么就删除该8位数据
比如上面的表
1599999和15999990,就相当于1599999这个7位数据转换后,它包含了15999990,所以认为15999990和7位的1599999重复,那么规则就是把这个8位数据给去掉.
那么经历上两个要求,我的最终数据为
f3
=======
1598750
1598751
1598752
1598753
1598754
1598755
1598756
1598757
1598758
1598759
1599999
1300909
19999999--不能转换为7位,又没有重复,就留下
得到全部为标准7位的数据,并且没有重复的