Exporter certaines pages d'un .PDF

albanet

Membre confirmé
12 Mai 2005
34
4
42
Bonjour,

Je cherche à exporter certaines pages non suivies de gros documents .pdf de plusieurs dizaines de pages.
En effectuant une recherche sur un terme bien précis, les différentes pages apparaissent, mais impossible de les compiler ou de les exporterons peut juste le faire page par page (on ne peut pas tout sélectionner d'un coup dans Aperçu).

J'ai essayé avec Adobe PDF reader, preview, pdf expert et pdfpenpro, ainsi qu'avec le site lovepdf.

Quelqu'un a t-il une idée pour faire cette manoeuvre ?

Merci d'avance.
 
Si tu peux te contenter des limitations d'Aperçu :
  • Tu affiches les vignettes dans la barre latérale
  • Tu fais une sélection discontinue des pages qui t'intéressent avec la touche cmd+clic
  • Menu Fichier > Imprimer les pages sélectionnées et tu choisis l'option Imprimer en PDF (bouton en bas à gauche chez moi).
 
Bonjour,

Tu peux sélectionner l'ensembles des pages souhaitées comme l'indique @baron, mais une fois que c'est fait, je trouve plus rapide de faire glisser la sélection sur le bureau; les pages du document original ne seront pas supprimées et se retrouveront dupliquées dans un autre (et unique) pdf.

Si tu peux te contenter des limitations d'Aperçu :
  • Tu affiches les vignettes dans la barre latérale
  • Tu fais une sélection discontinue des pages qui t'intéressent avec la touche cmd+clic
  • Menu Fichier > Imprimer les pages sélectionnées et tu choisis l'option Imprimer en PDF (bouton en bas à gauche chez moi).
C'est dommage cependant que l'on ne puisse pas sélectionner directement les pages qui apparaissent en vignettes après avoir fait une recherche; il faut retenir les numéros de pages, effacer le champ de recherche, puis là on peut sélectionner une à une, avec cmd-clic, les pages souhaitées (du moins c'est comme ça avec la dernière mise à jour de Mojave).
 
  • J’aime
Réactions: baron
merci de vos reponses, mais justement, on ne peut pas sélectionner plus d'une page de résultats de recherche, meme avec shift / ctrl / cmd... essayez dans un de vos documents, on ne peut sélectionner qu'une vignette de résultat de recherche à la fois, la seule astuce que je peux utiliser c'est toujours ca, c'est de retenir les numéros de pages (loin d'être idéal...). Merci en tous cas, si d'autres idées vous viennent, éventuellement meme dans d'autres programmes, meme payant je prends. Bon week end
 
Bonjour,
@albanet

Peut être une solution avec "adobe acrobat DC" et un petit script "automator+applescript".

Dis moi si tu es intéressé, "adobe acrobat DC" est payant... Je te ferais le script.
L'idée: extraire le texte, chercher dans chaque page si le mot existe, s'il n'existe pas, efface la page. A la fin il ne reste que les pages contenant le mot recherché.
 
  • J’aime
Réactions: albanet
Peut être une solution avec "adobe acrobat DC" et un petit script "automator+applescript".

Dis moi si tu es intéressé, "adobe acrobat DC" est payant... Je te ferais le script.
L'idée: extraire le texte, chercher dans chaque page si le mot existe, s'il n'existe pas, efface la page. A la fin il ne reste que les pages contenant le mot recherché.
salut et merci de ta proposition

Alors pour le coup, quand je pensais logiciel payant, je ne pensais pas m'abonner ad vitam à Adobe reader. Par contre, je me demande, est ce que le script marcherait avec le reader de adobe (qui lui reste gratuit) ?

en tous cas merci pour la proposition, cest sympa.
 
Dernière édition par un modérateur:
Bonsoir,
Alors non, le reader de chez adobe n'est pas scriptable...

Par contre je t'ai fait un petit script, qui fait le job.
Il est un peu long... mais bon!
Il est accessible là : http://dl.free.fr/nCB0ZskEt
Décompresse le fichier zip, tu obtien le fichier: Extraire page mot.workflow
Tu le lances (double clic) puis tu clique sur la flêche en haut à droite "Exécuter". il te demande de choisir le fichier pdf à traiter, puis il te demande d'entrer le mot ou la chaine à chercher.
Quand il a terminé il ouvre avec aperçu le nouveau fichier pdf. il te faut l'enregistrer.

Son fonctionnement:
Il crée 2 dossiers provisoires sur le bureau
il scinde le PDF en autant de PDF qu'il y a de pages, dans un des dossiers
Il extrait le texte de chaque page dans l'autre dossier
Il cherche dans ce texte si il y a la chaine... si non il efface la page
A la fin il refait un pdf avec les pages restantes
Il met dans la corbeille les 2 dossiers provisoires

Bon tests, j'attends ton retour.
 
Alors non, le reader de chez adobe n'est pas scriptable...
Si Acrobat Reader est scriptable, avec JavaScript, AppleScript et VB, mais bien entendu il n'a pas les mêmes possibilités qu'Acrobat Pro.
Par exemple il ne peut pas extraire de pages.
Voir : https://www.abracadabrapdf.net/category/utilitaires/utilitaires-reader/

Quelqu'un a t-il une idée pour faire cette manoeuvre ?
Avec Acrobat Pro c'est un jeu d'enfant, il suffit de télécharger l'Action qui est proposée (gratuitement) dans le 8e message de ce sujet et de double-cliquer dessus pour l'installer dans Acrobat Pro : https://abracadabrapdf.net/forum/index.php/topic,3410.msg20093.html
Ensuite il faut lancer l'Action et saisir le terme à rechercher, le reste est automatique.

La version d'essai d'Acrobat Pro fonctionne pendant 7 jours.

et tu choisis l'option Imprimer en PDF
Pourquoi il ne faut jamais faire ça, surtout avec les PDF Services de MacOS :
 
@magicPDF

Bonjour,
Je répondais à @albanet que, pour sa demande, le reader n'était pas scriptable avec applescript pour faire ce qu'il voulait. Avec Acrobat pro, pas de problème pour faire un script, par contre je ne connaissais pas l'action toute faite, Merci.

De toute manière je lui ai fait un script qui n'utilise que Automator, TextEdit et Apercu, 3 logiciel fournis avec le Mac...

Et de plus il y a la possibilité de le faire avec 2 petits scripts Automator + une recherche avec Spotlight (presque automatique)
  • avec Automator tu scindes le pdf en pages.
  • tu fais la recherche avec Spotlight (contenu contient le terme à rechercher)
  • tu sélectionnes le résultat de la recherche tu fais un copier, coller dans un nouveau dossier.
  • avec Automator tu combines les pages en 1 seul fichier PDF.
 
Dernière édition par un modérateur:
-avec automator tu scindes le pdf en pages.
-tu fais la recherche avec spotlight (contenu contient le terme à rechercher)
-Tu sélectionnes le résultat de la recherche tu fais un copier, coller dans un nouveau dossier.
-avec automator tu combines les pages en 1 seul fichier PDF.
Astucieux !
Je marque cette page car c'est une demande que j'ai parfois.
 
Bonsoir,
Alors non, le reader de chez adobe n'est pas scriptable...

Par contre je t'ai fait un petit script, qui fait le job.
Il est un peu long... mais bon!
Il est accessible là : http://dl.free.fr/nCB0ZskEt
Décompresse le fichier zip, tu obtien le fichier: Extraire page mot.workflow
Tu le lances (double clic) puis tu clique sur la flêche en haut à droite "Exécuter". il te demande de choisir le fichier pdf à traiter, puis il te demande d'entrer le mot ou la chaine à chercher.
Quand il a terminé il ouvre avec aperçu le nouveau fichier pdf. il te faut l'enregistrer.

Son fonctionnement:
Il crée 2 dossiers provisoires sur le bureau
il scinde le PDF en autant de PDF qu'il y a de pages, dans un des dossiers
Il extrait le texte de chaque page dans l'autre dossier
Il cherche dans ce texte si il y a la chaine... si non il efface la page
A la fin il refait un pdf avec les pages restantes
Il met dans la corbeille les 2 dossiers provisoires

Bon tests, j'attends ton retour.
Hé bien, c'est vraiment extrêmement gentil d'avoir pris du temps et d'écrire ce script. Ca me fait penser que je suis nul de ce coté si et qu'il faudra vraiment que je m penche sur automator un jour...

J'ai testé avec deux fichiers, un d'une 20aines de pages, ca a pris quelques secondes et ca a fonctionné direct (par contre le fichier crée se range directement à la poubelle o_O), j'ai aussi essayé sur un plus gros fichier d'environ 300 pages et ca a fonctionné, mais plus lentement (ce qui est normal j'imagine...).

J'ai converti le script est action rapide, elle est proposée par défaut avec un cli droit dans le Finder, donc c'est royal.

Je retiens au cas ou aussi les suggestions des collègues à propos des script de Adobe, mais pour ce que j'ai à faire, ta solution est parfaite !

Donc MERCI beaucoup à tous les intervenants, c'est vraiment un plaisir d'avoir affaire à des personnes généreuses.
Je mets le sujet en RESOLU du coup.

Bonne journée.
 
Dernière édition:
  • J’aime
Réactions: JLB21 et magicPDF
Si Acrobat Reader est scriptable, avec JavaScript, AppleScript et VB, mais bien entendu il n'a pas les mêmes possibilités qu'Acrobat Pro.
Par exemple il ne peut pas extraire de pages.
Voir : https://www.abracadabrapdf.net/category/utilitaires/utilitaires-reader/


Avec Acrobat Pro c'est un jeu d'enfant, il suffit de télécharger l'Action qui est proposée (gratuitement) dans le 8e message de ce sujet et de double-cliquer dessus pour l'installer dans Acrobat Pro : https://abracadabrapdf.net/forum/index.php/topic,3410.msg20093.html
Ensuite il faut lancer l'Action et saisir le terme à rechercher, le reste est automatique.

La version d'essai d'Acrobat Pro fonctionne pendant 7 jours.


Pourquoi il ne faut jamais faire ça, surtout avec les PDF Services de MacOS :
Bonjour,

Pour ceux qui on Acrobat Pro et qui sont intéressés, j'ai écrit une action qui fait ça très bien... et c'est gratuit !

Capture d’écran 2021-01-21 à 15.22.42.png

Vous allez sur le forum abracadrabraPDF et vous ouvrez un post ou vous me contactez via ma boite mail du forum.

Je vous retournerai le fichier de l'action.
@+
 
Dernière édition par un modérateur:
  • J’aime
Réactions: magicPDF
Si tu peux te contenter des limitations d'Aperçu :
  • […]
  • Menu Fichier > Imprimer les pages sélectionnées et tu choisis l'option Imprimer en PDF (bouton en bas à gauche chez moi).
Pourquoi il ne faut jamais faire ça, surtout avec les PDF Services de MacOS :
https://forum.macbidouille.com/index.php?showtopic=294653&st=0&p=2942330&#entry2942330
Tu as bien raison de renouveler la mise en garde (c'est d'ailleurs bien pour ça que je commençais ma réponse par « Si tu peux te contenter des limitations d'Aperçu »).
Toutefois à ma connaissance, les services Apple d'impression en PDF ne passent plus par l'étape PostScript qui fait l'objet de l'article traduit par Cri-cri.

Je ne suis d'ailleurs pas certain que le passage par Automator pour recombiner les pages fonctionne différemment de la fenêtre d'impression ?
 
Dernière édition:
J'ai testé avec deux fichiers, un d'une 20aines de pages, ca a pris quelques secondes et ca a fonctionné direct (par contre le fichier crée se range directement à la poubelle o_O), j'ai aussi essayé sur un plus gros fichier d'environ 300 pages et ca a fonctionné, mais plus lentement (ce qui est normal j'imagine...).
Bonsoir,
Je te l'avais précisé dans mon message.
Quand il a terminé il ouvre avec aperçu le nouveau fichier pdf. il te faut l'enregistrer.
Si cela te convient alors content pour toi.
Finalement tu as maintenant plusieurs solutions.... ;) :up:
 
@albanet
Bonjour,

Je te joins un autre script automator qui sera un peu plus rapide.
Il ne se sert plus de TextEdit pour ouvrir le fichier avant de faire la recherche.

Il y a un mais ! je suis tombé lors de mes essais sur un fichier PDF qui avait certaines pages encodées au format UTF-16, donc le script ne trouve aucun résultat dans ces pages, Alors que l'ancien script en trouvait car TextEdit ouvrait en décodant le texte...

Le nouveau script à récupérer la: http://dl.free.fr/j4ugl1k8a

Bon tests !
 
Bonjour !
Vous pouvez également utiliser un outil en ligne pour extraire des pages d'un pdf. Faites en la recherche sur internet. Ca pullule de bons outils !