mDF XLdoublons : mode d'emploi
Catégorie : Utilitaires
Publié par myDearFriend! le 05-01-2009
Téléchargez la dernière version ! mDF XLdoublons
Intuitif, plus rapide et toujours aussi efficace,
un utilitaire indispensable pour vos bases de données !


Compatible PC Excel 2000-2007
Le traitement des doublons sur Excel par myDearFriend!
____________


 

 
mDF XLdoublons


telechargement 



PRESENTATION
 

 

mDF XLdoublons est un complément pour Excel.

 

Une fois installé (comme toute macro complémentaire) , cet utilitaire ultra simple et rapide vous aide à assainir et exploiter au mieux vos bases de données en toute sécurité et toujours dans le respect du format original de vos enregistrements.

 

Cet outil autorise une détection des doublons sur colonnes multiples et met à votre disposition différents traitements paramétrables :

 

  • mettre en évidence les doublons présents dans vos bases de données (surlignage en couleur),
  • masquer les lignes doublons,
  • supprimer les éléments dupliqués,
  • extraire et archiver les enregistrements en double (mode par défaut).

 

Grâce à son interface intuitive et largement documentée, vous restez toujours maître de l'opération à réaliser.

 

Différentes options vous sont proposées :

 

  • Choix des colonnes (champs) à prendre en compte pour la détection des doublons.
  • Respect ou non de la casse (minuscules / majuscules) pour la comparaison des éléments.
  • Traitement direct sur l'onglet original ou sur une copie de la feuille (travailler  toujours à partir d'une copie de vos documents ! C'est élémentaire.).
  • Désignation des occurences « doublons » à traiter :
    •  
      •  
        • Toutes, sauf la première occurence : correspond à l'option par défaut. Cela signifie : on parcourt la base de données, on ne touche pas à la première occurrence  d'un enregistrement détecté comme doublon (on le laisse tel quel), mais on traite (surligne, masque ou supprime) les occurences suivantes de ce doublon.
        • Toutes, sauf la dernière occurence : c'est la même chose, mais en sens inverse (on ne touche pas à la dernière, mais on traite les précédentes).
        • Toutes les occurences : signifie qu'on souhaite traiter toutes les lignes détectées comme élément dupliqué.

 Haut


QUOI DE NEUF DANS CETTE VERSION ?

 

Comme pour la majorité des utilitaires signés myDearFriend! et présentés sur ce site, changement de nom pour cet outil : l'ancien mDF Doublons devient mDF XLdoublons à partir de ce jour.

Dorénavant, cette application est compatible avec les versions PC Excel 2000 à 2007.


HISTORIQUE DES VERSIONS

VERSION 5.0 - Mai 2009

 

  1.  
    1.  
      1. Routines VBA revisitées en profondeur : les traitements sont aujourd'hui 10 fois plus rapides qu'avec la version v4.x précédente et respecte toujours le format original de vos données et cellules ! Ce format original est également conservé sur l'onglet d'archivage.
      2. La compatibilité avec le Ruban d'Excel 2007 est améliorée. L'affichage de l'onglet « Compléments » et du bouton « mDF XLdoublons » ne devrait plus poser de problème. A toutes fins utiles, et uniquement pour cette version XL2007, l'utilitaire peut également être lancé par le menu contextuel (clic droit) de cellules.
      3. Le report d'une zone de titre (de une à cinq lignes) est maintenant possible lors de l'archivage. Les lignes composant cette zone de titre sont exclues du traitement des doublons et reportées - telles quelles - sur l'onglet d'archive.
      4. Lorsque l'utilisateur choisit l'option « Surligner les doublons » et opte pour le traitement de « Toutes les occurences », possibilité de surligner la 1ère occurence d'une ligne doublon avec une couleur distincte.
      5. La largeur des colonnes peut être ajustée automatiquement dans l'interface pour le confort de l'utilisateur.
      6. Correctif d'un bug mineur : La tentative d'utilisation sur une feuille protégée ne génère plus d'erreur (message d'alerte).

 

VERSION 4.2 - Août 2008

 

  1.  
    1.  
      1. Le fonctionnement sous Excel 2000 est maintenant assuré.
        mDF XLdoublons est dorénavant compatible PC Excel 2000, 2002, 2003 et 2007.
        Sous Excel 2007 toutefois, et sous certaines configurations seulement (non encore ciblées), le bouton de lancement de l'utilitaire semble ne pas être accessible dans le Ruban : en fait, c'est l'onglet « Compléments » qui n'apparaît pas sous ces configurations... ce problème est à revoir lors de la prochaine version de l'utilitaire.
      2. Correctif d'un bug mineur.

VERSION 4.0 - Juillet 2006

 

  1.  
    1.  
      1. Une interface entièrement repensée : le choix des colonnes à prendre en compte est maintenant beaucoup plus intuitif. Il en est de même pour les options de traitement présentées.
      2. A la suppression et l'archivage des lignes doublons, ajout des traitements suivants : mettre en évidence (surligner) et masquer.
      3. Propose un traitement direct sur l'onglet original ou sur une copie de la feuille pour encore plus de sécurité.
      4. Choix possible du respect de la casse - ou non - pour la comparaison des éléments.
      5. Autorise le traitement de la totalité des occurences « doublons » rencontrées ou toutes sauf la première ou bien, toutes sauf la dernière.
      6. La compatibilité est normalement assurée à partir de Excel 2002.

VERSION 3.1 - Janvier 2005

 

  1.  
    1.  
      1. Ajout de l'option d'Archivage des éléments épurés.
      2. Le nombre maximum de doublons détectés était de 32 767. Ce maximum peut maintenant être dépassé sans erreur.
      3. Correctif de bugs mineurs.
VERSION 1.0 - Juillet 2004

 

C'est d'abord dans le cadre de mon activité professionnelle qu'est née l'idée de cet utilitaire. Ayant alors à exploiter de grandes bases de données issues de requêtes Infocentre, l'outil à notre disposition obligeait malheureusement à divers traitements manuels très rébarbatifs. Je ne compte plus le nombre d'heures passé à trier, dédoublonner et épurer ces bases manuellement .. Bref, un travail pas vraiment passionnant et contre-productif à souhait !


Et c'est à l'occasion d'un fil de discussions du forum XLD "Macro pour doublons " que je pris conscience du besoin en la matière et que j'e décidais de prendre enfin le temps de me consacrer à cet utilitaire...


Les bases de cet outil était posées : permettre la suppression automatique et sûre d'éléments dupliqués dans une base de données, en laissant l'utilisateur désigner lui-même les colonnes (ou champs) à analyser.

Pour des raisons pratiques, le principe d'une macro complémentaire fût retenu : l'application était basée sur un simple userform composé d'une ListBox multicolonnes et de 3 boutons...


Haut

DEMARRAGE RAPIDE

Une fois cette macro complémentaire installée , vous accédez à l'outil par un bouton xldoublonsbtn situé dans la barre d'outils standard d'Excel (ou dans l'onglet Compléments du Ruban Excel 2007). Notez que pour cette version Excel 2007, vous pouvez également accéder à l'utilitaire par le menu contextuel (clic droit) des cellules.

Voici le principe de fonctionnement :

Une fois votre base de données ouverte dans Excel, lancez mDF XLdoublons. L'interface de l'utilitaire s'affiche alors :

L'interface de mDF XLdoublons v5.0


EXEMPLES SIMPLES D'UTILISATION
Par exemple, prenons la base de données suivante (dans un onglet nommé « Contacts ») :

mDF XLdoublons

Si ma base est saine, je ne devrais détecter aucune ligne entière « doublon » (même nom, même prénom, même adresse, etc...). Vérifions cette situation :
  • Je lance mDF XLdoublons,
  • Dans l'interface, je sélectionne toutes les colonnes (= tous les champs). Cette opération est réalisable en cliquant sur chaque entête de colonne de la grille ou plus simplement en cliquant sur le bouton mDF XLdoublons,
  • Puis, tout en bas et à gauche de l'interface , je clique simplement sur le bouton mDF XLdoublons.
Après une courte analyse de la base (et sans même avoir lancé un traitement proprement dit !)... j'obtiens dans le titre de ce même bouton l'information souhaitée : 0 doublon détecté.

Ma base est donc saine sur ce point, me voici rassuré clin d'oeil


Maintenant, je souhaite extraire de la base les contacts ayant le même nom de famille :
L'analyse sera donc ciblée cette fois uniquement sur la première colonne de données.
  • Je déselectionne l'ensemble des colonnes (je le fais d'une traite, grâce au bouton mDF XLdoublons, c'est plus facile comme ça),
  • Je clique cette fois sur l'entête de l'unique colonne A (= le champ « NOM » de la base),
  • Je vérifie que l'option par défaut « Dupliquer la feuille avant traitement » soit toujours active.
  • Je choisis le mode de traitement : « Extraire et archiver les lignes doublons »,
  • Comme je veux obtenir tous les contacts en situation d'homonymie, je sélectionne également l'option : « Toutes les occurences doublons »,
  • Je clique finalement directement sur le bouton mDF XLdoublons.
Après une courte analyse et le traitement, l'interface de l'application disparaît et j'obtiens 2 nouveaux onglets dans mon classeur :
  1. Un nouvel onglet nommé "mDF » Contacts" : il s'agit d'un duplicata de la base de données originale, mais dont les éléments doublons ont été cette fois extraits (supprimés).
  2. Un nouvel onglet nommé "mDF » doublons archivés" : comme son nom l'indique, c'est ici que vont être « archivées » les lignes doublons extraites de la base originale.
Dans ce dernier onglet d'archive, je découvre deux lignes extraites et transférées là, telles quelles. En effet, ma base de données originales ne comprenaient que deux contacts avec nom de famille identique.

D'ailleurs, en zoomant un peu sur la copie d'écran présentée plus haut, on peut apercevoir ces deux homonymes (je les ai mis en évidence ci-dessous en jaune). Deux contacts ont le même NOM de famille « ICKSELDEZ » :

mDF XLdoublons

Pour bien comprendre la notion d'« occurences » qu'il convient de cibler, si vous avez bien suivi l'exemple précédent, vous aurez compris que si j'avais choisi l'option « Toutes sauf première occurence », seul le contact Pascal ICKSELDEZ aurait été extrait de la base.
Et, bien sûr, si j'avais choisi « Toutes sauf dernière occurence », c'est uniquement Michel ICKSELDEZ qui aurait fait l'objet de cette même opération.

Vous devriez maintenant comprendre le fonctionnement de cet outil qui met à votre disposition un très large panel de traitements réalisables.

Vous trouverez également ci-dessous une description des différents éléments de l'interface utilisateur.

Sachez également qu'une aide est déjà intégrée à cette interface et activable par la case à cocher « Aide » au bas du formulaire.

Haut

DESCRIPTION DE L'INTERFACE
 

mDF XLdoublons

 Haut

MODES DE TRAITEMENT DISPONIBLES
 

I - SURLIGNER LES LIGNES DOUBLONS
mDF XLdoublons permet de mettre en évidence (surligner) les lignes doublons en les surlignant d'une couleur choisie par l'utilisateur. 10 couleurs sont disponibles.

  • Choix de la couleur :
    Une fois le mode de traitement « Surligner les lignes doublons » sélectionné, survolez le pavé « doublons » avec le curseur de la souris :
    mDF XLdoublons

    Un panel de 10 couleurs prédéterminées apparaît :
    mDF XLdoublons

    Faites votre choix dans ce panel par un simple clic de la souris.

  • Différencier la première occurence :
    Si vous avez également sélectionné l'option « Toutes les occurences », vous avez aussi la possibilité de choisir une autre couleur pour distinguer la première occurence « doublon » rencontrée :
    mDF XLdoublons

    Le principe reste le même que ci-dessus : survolez le pavé « 1ère occ. » et choisissez la couleur souhaitée pour la première occurence doublon rencontrée.



II - MASQUER LES LIGNES DOUBLONS
Ce mode de traitement consiste à cacher (masquer) les lignes « doublons » dans la base de données.

mDF XLdoublons

Par la suite, il est facile de réafficher les lignes ainsi masquées. Pour ce faire :
  • Sélectionnez l'ensemble des lignes de la base (ou faites CTRL + A pour sélectionner l'ensemble des cellules de la feuille) ,
  • Puis, faites menu Format / Ligne / Afficher.



III - SUPPRIMER LES LIGNES DOUBLONS
Il s'agit certainement là du mode de traitement le plus basic et le plus attendu pour ce type d'application.

Les lignes détectées comme « doublons » sont tout simplement supprimées de la base de données (ou de son duplicata !).

mDF XLdoublons




IV - EXTRAIRE ET ARCHIVER LES LIGNES DOUBLONS
Ce mode de traitement est le mode sélectionné par défaut au lancement de l'utilitaire.

Le principe reste le même que pour le mode « Supprimer les lignes doublons ». Toutefois, les lignes détectées et extraites de la base de données sont archivées dans un onglet automatiquement créé à cette fin.

mDF XLdoublons

Ce mode donne également accès à une option supplémentaire :
Vous avez la possibilité d'indiquer si votre base de données originale comprend un entête (une ou plusieurs lignes en haut du tableau, correspondant aux titres des champs). Si tel est le cas, il conviendra de cocher l'option « Entête du tableau pour archive » et de préciser le nombre de lignes réservées à cet effet (5 au maximum)... Ces lignes seront représentées en gras dans la grille de données de l'utilitaire et prises en compte lors du traitement.

Bien entendu, les lignes désignées comme telles, seront exclues de la détection et de l'extraction des doublons. En parallèle, cet entête sera automatiquement reporté sur l'onglet d'archive.

Haut

REMERCIEMENTS...

Je tiens à remercier les utilisateurs de l'ancienne version de mDF XLdoublons qui m'ont adressé leurs impressions, leurs critiques et suggestions ainsi que leurs encouragements. Remerciements particuliers à Chris pour ses remarques et suggestions toujours aussi pertinentes. Enfin, un grand merci à JeanMarie, jeanpierre et à nouveau Chris pour les tests de compatibilité sur Excel 2000, ainsi qu'à fred65200 pour son analyse du problème de compatibilité précédemment rencontré avec le ruban d'XL2007.
 Haut

 
N'hésitez pas à poser vos questions ou déposer vos suggestions dans le Forum de discussions consacré au Site et son contenu .
Pour toutes vos questions ou si vous rencontrez des difficultés, n'hésitez pas à rejoindre nos Forums de Discussions !