论文部分内容阅读
由于数据来源复杂,日积月累,数据库中有很多重复数据。在“电话号码”和“手机号码”字段数据中,不单单只有号码,还有汉字等,有的记录甚至有二三个号码;本文根据以上实际情况,提出了一种查出“重复”数据的模糊匹配算法,算法的基本思路是:从记录中,单单取出数字号码,然后进行比对。在匹配算法设计中,考虑了影响程序运行的各种各样差错、数据“异构”的情况。