Caractéristiques du dedoublonnage DQE Batch
Une solution anti doublons simple et complète
La solution de dedoublonnage DQE Batch est une suite logicielle
commercialisée par Experian QAS. Elle répond à une
problématique forte du
Contact
Data Management : le dedoublonnage de vos données.
Cette solution
anti doublons possède un mode de fonctionnement
en plusieurs étapes :
-
La découverte et la standardisation des données
Cette première étape permet à DQE Batch d'analyser
l'ensemble de vos enregistrements existants afin de détecter la
nature des informations stockées. Ainsi, l'opération de
standardisation
des données (mise au format prédéfini des
données) sera optimisée. Par exemple, les numéros
de téléphone seront tous remis au même format, ce
qui facilitera par la suite l'opération de dedoublonnage.
-
Le dedoublonnage et la deduplication
Le
dedoublonnage de vos
données, qui correspond à la suppression des
enregistrements identiques au sein d'un fichier, permet
l'identification des entrées redondantes au sein de votre
fichier.
Plusieurs critères de dedoublonnage peuvent
être utilisés de manière simultanée, avec
la possibilité pour chaque clé de dedoublonnage
d'effectuer une recherche à l'identique, avec un terme
approchant, ou considérant les fautes d'orthographe, les
écarts phonétiques, ou encore les inversions de mots.
-
L'affinage des traitements
La solution de dedoublonnage DQE Batch propose une innovation majeure,
l'affinage des traitements des fichiers que vous effectuez. De cette
manière vous êtes en mesure d'affiner l'extraction des
enregistrements identiques depuis vos fichiers.
Il est aussi possible d'appliquer cette solution anti doublons sur plusieurs de vos fichiers. Le dedoublonnage se fait alors entre les différentes sources : c'est ce qu'on appelle la deduplication.
Voici un exemple de succession de filtres anti-doublons que vous pouvez réaliser :
- Traitement 1 : retirer les fiches identiques - 100 % de certitude
- Traitement 2 : retirer ensuite les fiches très proches - 95 %
- Traitement 3 : retirer ensuite les fiches proches - 85 %
etc.
Au final un fichier résumant l'ensemble de vos traitements sera constitué.
Les principes du
dedoublonnage
curatif DQE Batch
Les avantages du dedoublonnage
et de la deduplication
Support