Le dédoublonnage est l’un des exercices les plus complexes à réaliser, le dédoublonnage consiste à identifier les enregistrements en double à l’intérieur d’un fichier
Cette identification permet la suppression des doublons, triplons…. Après avoir récupérer les historiques attachés à ces doublons, lorsque cela est utile.
- Logiciel spécifique, adapté au traitement d’adresses françaises et internationales
- Match code (profil), phonétisation, prépondérance et position des mots dans les champs
- Le calcul du profil est entièrement paramétrable selon la qualité des données en entrée et la finesse de déduplication que l’on souhaite obtenir.
- Plusieurs méthodes peuvent être employées sur un même fichier et fusionnées en fin de traitement.
- Gestion des différents cas:
- Over Kill (fichiers de prospects) ou Under Kill (fichiers de clients)
- Dédoublonnage Individus ou Foyers (BtoC)
- Listes de doublons douteux à valider
Le dédoublonnage est en principe effectué en fin de traitement d’enrichissement, afin d’optimiser la qualité finale.
- Over Kill : On a tendance à approcher un maximum d’enregistrements, même si certains rapprochements sont douteux
- Under Kill : Nous ne prenons pas de risque sur le rapprochement d’enregistrements qui pourraient être douteux. Nous ne prenons en compte que les rapprochements certains.

