表重复数据查找的问题,(根据某一字段的数据相似性)求救!!!!!
问题如题,说明的是:现在有一张表(ID,名称,区域,详细地址...)数据量比较大,表中有许多的重复数据。由于不同用户在界面输入数据的时候在"名称"输入框中输入的数据不一致,而表达的是同一个名称(例如:北京21届国际博览会和2009年北京第21届国际博览会),现在我需要把“名称”这个字段相似的数据找出来显示到grid中,或是按对比相似的概率找出来,注:每天记录的ID是不同的。请请各位帮忙看看有没有好的思路建议或者好的算法教教小弟,等候大家帮忙咯,分数是少了点,本人好久没上来啦以后补上啦。