0 votes

Diviser un énorme PDF en plusieurs fichiers .txt séparés.

J'ai un fichier PDF contenant deux années d'entrées de journal qui ont été exportées de MacJournal en 2009. J'utilise maintenant Day One, qui permet à CLI d'importer des fichiers .txt.

Ma question est la suivante : est-il possible d'exporter un PDF d'entrées formatées (avec la date) dans des fichiers .txt individuels de chaque entrée séparée (avec le nom de fichier de mois/jour/année.txt) ?

1voto

Essayez d'abord d'utiliser pdftotext ou ebook-convert pour convertir le PDF en texte :

brew install poppler;pdftotext file.pdf

/Applications/calibre.app/Contents/MacOS/ebook-convert file.pdf file.txt

Alors si par exemple le fichier texte a un format comme celui-ci :

2012-12-31
paragraph 1
paragraph 2

2013-01-01
paragraph 1
paragraph 2

Essayez d'exécuter une commande comme celle-ci :

awk -v RS= -F'\n' '{print $0>($1".txt")}' file.txt

Ou si le fichier texte a un format comme celui-ci :

2012-12-31

paragraph 1

paragraph 2

2013-01-01

paragraph 1

paragraph 2

Essayez d'exécuter une commande comme celle-ci :

ruby -e '$<.read.split("\n\n\n").each{|s|title,content=s.split("\n\n",2)
File.open(title+".txt","w"){|f|f.puts content}}' input.txt

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X