Recherche de doublons dans TextEdit

GraphiqueDesign

Membre expert
Club iGen
Bonjour !

J'ai un fichier TextEdit avec une liste de noms (1 nom par ligne), environ plusieurs centaines.
On me demande de trouver les doublons.
J'ai utilisé Services > Format de texte > Trier les lignes par ordre alphabétique pour déjà me faciliter la tache mais cela prendra quand même beaucoup de temps et la recherche visuelle de doublons risque de comporter des erreurs.

Connaissez-vous un script pour Services ou un programme externe pour effectuer cette recherche ?
C'est quand même incroyable de ne pas trouver le moyen de recenser facilement 2 strings (chaînes de caractères) identiques dans un fichier text !
Merci à vous !
 
Bonsoir,
J'aurai utilisé Excel.
La visibilité me semble meilleure.

Importe ton fichier texte, il va le lire.

Après on peut faire une macro, mais c'est un peu plus "savant", quoique

PRINCIPE

a = resultat(Lire 1ère ligne)
si erreur aller à fin
étiq1:
b = résultat(Lire la suivante)
si erreur aller à fin
comparer a et b
si égaux : Supprimer la ligne courante - celle qui correspond à b
aller à etiq1
sinon
a=b
aller à étiq1
fin:

Il y a sûrement sur ce forum des qui ont ça déjà codé...
 
Ben pas besoin de passer par Excel, ce programme peut aussi bien être créé en AppleScript directement pour TextEdit, tout aussi facilement qu'en VBA !
 
Dans Excel, pas besoin de macro. Il faut passer par le menu "Données" et faire un filtre élaboré. Tu demandes alors à faire une extraction sans doublons et le tour est joué !

S'il ne s'agit pas de supprimer les doublons mais seulement de les identifier, la fonction NB.SI() permet de le faire. Par exemple en saisissant dans une colonne vide quelque chose comme =NB.SI(A:A;"=A1) et en le recopiant vers le bas, tu auras le nombre d'équivalences.
 
Dernière édition:
J'ai testé Smultron mais le problème est un peu plus compliqué car finalement, les entrées sont de type: nom - classement. Par exemple, voici un petit bout de la longue liste:

AmePion - S2V5
Amyga - S2V9
Anciensewb - S1V3
Angelys - S2V9
Ankem - S2V8
antokoo - S1V6
antokoo - S1V8
arama - S2V11
aranud - S1V4
Arbyter - S2V1
Architroudbald - S1V7


Et donc, la recherche de doublons devrait se faire sur la partie nom de chaque entrée uniquement ce qui se présente difficile voire impossible à faire pour Smultron.

Alors je suis tombé sur un monsieur bien balaize en programmation qui m'a donné un code à entrer dans le Terminal ...

cat ~/Desktop/fichier.txt | cut -d " " -f1 | sort | uniq -c | egrep -v 1

Le résultat est stupéfiant de simplicité et de rapidité car d'une liste de plusieurs milliers d'entrées, il me sort tous les doublons dans une autre liste.

Voilà, mon problème est résolu et peut être pourra ceci aider quelqu'un d'autre un jour.
Merci à vous !