0 votes

Comment rechercher des PDF et extraire les pages correspondantes avec Automator ?

J'essaie de créer un flux de travail Automator qui me permettra de.. :

  1. Spécifiez un dossier dans lequel les actions doivent être exécutées
  2. Rechercher un certain mot (le nom de mon client) dans tous les fichiers PDF de ce dossier.
  3. Créer un nouveau fichier PDF contenant uniquement les pages sur lesquelles figure le nom de mon client.
  4. Enregistrer ce fichier sur le bureau

enter image description here

Jusqu'à présent, je peux effectuer les étapes 1 et 2. Mais existe-t-il un moyen de voir sur quelles pages se trouvent les correspondances ou de créer un nouveau PDF pour les pages correspondantes ?

1voto

Vic Points 1820

Je me rends compte que cela fait un an que vous avez posé la question, mais j'ai aimé le défi. Voici donc, en résumé, comment je procéderais...

  • Pour chaque PDF dans le dossier, convertissez-le en texte.
  • Utilisez une commande perl pour rechercher des mots-clés dans les fichiers texte et renvoyer le(s) numéro(s) de page(s).
  • Utilisez un outil de ligne de commande pour extraire une ou plusieurs pages du PDF.
  • Fusionner les pages extraites.

Vous pouvez faire la première partie assez facilement avec applescript/automator.

La commande perl pour obtenir les numéros de page est la suivante :

perl -ne 'print "$1$2" if /blah/ .. /--- Page (\d+) ---(\n)/'

L'outil de commande à utiliser pour extraire les pages d'un fichier PDF se trouve à l'adresse suivante users.skynet.be/tools/

Enfin, la fusion des pages individuelles peut être réalisée à l'aide de l'automate ou des outils ci-dessus.

J'espère que cela vous aidera.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X