Bonjour,
J'ai un dossier contenant des fichiers textes contenant des tonnes d'email d'un grand nombre de pays.
Chaque email est sur une ligne. le format ressemble a "[email protected]:diverscaracteres" ( xx peut etre soit fr, be, it, com, etc, etc...)
A NOTER : le separateur en l'adresse mail et le "diverscarateres" peut etre soit ":" ou ";" ou "TAB" ou "ESPACE".
[email protected]:diverscaracteres
[email protected];diverscaracteres
[email protected] "TABULATION" diverscaracteres
[email protected] "ESPACE" diverscaracteres
J'ai peu de connaissance avec les commandes du terminal, j'ai recuperé les commandes sed sur le net et adapté comme j'ai pu.
Comment faire pour extraire les emails, mais sauvegarder les .be dans un fichier BE.TXT, les .fr dans un fichier FR.txt, les .it dans IT.TXT, etc...., en 1 seul passe ?
Actuellement le tri se fait pays par pays, vu la quantité d'emails a traiter, 1 seul pays me prend au moins 5 heures.
la liste des extension a trier (35 differents)
.at .ba .be .bg .ca .ch .cl .cz .dk .dz .ee .edu .es .eu .fi .fr .uk .gr .hu .ie .il .is .it .li .lu .mc .nl .pl .pt .se .si .va .net .org .com
Je ne sais meme pas si ma requete est possible.
Merci
J'ai un dossier contenant des fichiers textes contenant des tonnes d'email d'un grand nombre de pays.
Chaque email est sur une ligne. le format ressemble a "[email protected]:diverscaracteres" ( xx peut etre soit fr, be, it, com, etc, etc...)
A NOTER : le separateur en l'adresse mail et le "diverscarateres" peut etre soit ":" ou ";" ou "TAB" ou "ESPACE".
[email protected]:diverscaracteres
[email protected];diverscaracteres
[email protected] "TABULATION" diverscaracteres
[email protected] "ESPACE" diverscaracteres
J'ai peu de connaissance avec les commandes du terminal, j'ai recuperé les commandes sed sur le net et adapté comme j'ai pu.
- Dans le terminal je fais CD "mondossierousetrouvelesfichierstextecontenanlesemails"
- J'ai bien la commande pour extraire les emails en ".be" du fichier source puis sauvegarder dans un fichier texte.
Bloc de code:
sed -n "/@.*\.be[: ;, ]/p" *.txt > /fichieravecemailBE.txt
Comment faire pour extraire les emails, mais sauvegarder les .be dans un fichier BE.TXT, les .fr dans un fichier FR.txt, les .it dans IT.TXT, etc...., en 1 seul passe ?
Actuellement le tri se fait pays par pays, vu la quantité d'emails a traiter, 1 seul pays me prend au moins 5 heures.
la liste des extension a trier (35 differents)
.at .ba .be .bg .ca .ch .cl .cz .dk .dz .ee .edu .es .eu .fi .fr .uk .gr .hu .ie .il .is .it .li .lu .mc .nl .pl .pt .se .si .va .net .org .com
Je ne sais meme pas si ma requete est possible.
Merci