5 votes

Quel logiciel d'OCR scriptable existe sur OSX pour un bureau sans papier ?

J'ai l'intention de mettre en place un bureau sans papier et pour cela, j'ai besoin d'un bon logiciel d'OCR scriptable pour OS X ?

J'ai lu un blogpost par Marco Arment à propos de quelques programmes. Y en a-t-il qui fonctionnent et qui me permettent de script des choses ?

2voto

xilopaint Points 136

OCRKit dispose à la fois d'un support AppleScript et d'une CLI. De leur page d'aide :

AppleScript

Vous pouvez également script OCRKit pour l'intégrer dans votre flux de travail spécifique. Par exemple, traiter les fichiers entrants, via un dossier partagé, à partir d'un copieur MFP, etc. etc. et dire simplement à OCRKit d'ouvrir et donc de traiter ces fichiers par le biais de AppleScript :

tell application "OCRKit"
   -- the wonders of AppleScript POSIX path handling, ...
   open "Users:admin:Desktop:orderform.pdf"
   open POSIX path of "/Users/Admin/Desktop/orderform.pdf"
end tell 

Ligne de commande

Depuis la version 2.5 d'OCRKit, les scripts en ligne de commande directe sont pris en charge. Cela simplifie grandement l'utilisation d'OCRKit dans le cadre d'un traitement par lots, permet de de définir plus d'options et est également plus robuste et multiplateforme que la version 2.5. AppleSCript.

OCRKit.app/Contents/MacOS/OCRKit \ 
    --lang en | de | fr | es | ... \
    --format pdf | html | rtf | text \
    --no-progress \
    --output out-file in-file

Depuis la version 16.9 d'OCRKit, des options de ligne de commande supplémentaires sont prises en charge :

-r, --recursive directory

Recherche récursive de nouveaux fichiers dans le répertoire. Ignore les fichiers d'OCRKit, avec une couche de texte ou des graphiques vectoriels.

--pattern "regex"

Motif utilisé pour faire correspondre les noms de fichiers pendant les analyses récursives. La valeur par défaut est %.pdf$ La recommandation pour le TIFF est %.tiff?$

--log file

Écrire les informations et les statistiques du fichier journal pendant l'analyse récursive dans le fichier.

--password secret

Utilisez un mot de passe secret pour décrypter les fichiers PDF pendant le traitement par lots.

--test-run [ fast ]

Exécutez uniquement le traitement par lots en mode test pour tester les fichiers PDF ou pour obtenir le nombre de pages pour estimer le temps de traitement total. "rapide" ne vérifiera seulement la première page de chaque fichier, au lieu de parcourir toutes les pages pour les l'analyse des images et des vecteurs.

--tag name

Utilisez le nom de l'attribut étendu pour marquer l'état de traitement des fichiers pendant le traitement par lots. macos:OCRKit (%s) utilisera le système natif de MacOS Finder à la place, ou simplement macos:OCRKit sans compter l'État l'attribut state. L'ordre de l'attribut state sont : started , analyzed , processed et peut également être encrypted .

1voto

daviesgeek Points 35275

Readiris pour Mac. Je l'ai, mais je ne l'ai pas utilisé depuis longtemps, donc je ne me souviens pas exactement de sa qualité. Je pense qu'il ne faisait pas très bien les premiers documents, mais il apprend.

Oh, et je ne suis pas sûr de la scriptabilité. Je vais vérifier.

Il semble que Readiris dispose d'un dictionnaire de scripts, et il est plutôt bon.

0voto

Mockman Points 847

ABBYY FineReader Pro pour Mac fait bien l'OCR et est scriptable. De leur page de présentation :

Traiter des lots de documents et automatiser les tâches de conversion

Atteignez de nouveaux niveaux de productivité et profitez d'une plus grande souplesse lors de la conversion de documents grâce à la prise en charge des actions Automator et des commandes AppleScript.

Il prend en charge à la fois Applescript et Automator. Je n'avais pas essayé de l'automatiser auparavant, mais après l'avoir examiné, j'ai l'intention de faire quelques trucs de base. C'est la raison pour laquelle je réponds tardivement à cette question.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X