3 votes

Existe-t-il des outils plus robustes qu'Automator pour extraire du texte de plusieurs PDF ?

Il existe une action dans Automator qui vous permet de programmer " Extraire le texte d'un PDF "mais il échoue lorsqu'il reçoit un nombre modéré de fichiers (25 à 100). Pire encore, il échoue sans enregistrer quoi que ce soit d'utile, à l'exception d'un message indiquant que "Automator Quit Unexpectedly".

Quelqu'un connaît-il une commande équivalente pour faire cela en Applescript ? Je suis à la recherche d'outils me permettant de mieux contrôler des éléments tels que la journalisation et la gestion des erreurs, afin d'être plus efficace dans le traitement des fichiers PDF au format texte.

2voto

Je ne sais pas ce qu'il en est par rapport à d'autres options, mais vous pouvez utiliser pdfotext. Il peut être installé avec brew install xpdf .

do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings

Calibre est également livré avec quelques utilitaires de ligne de commande :

/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt

Questions connexes :

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X