11 votes

La conversion d'une capture d'écran en OCR est-elle possible sous MacOS ?

Je veux pouvoir faire une capture d'écran sur mon Mac, puis l'envoyer à un moteur OCR et récupérer le texte qu'il a identifié.

Existe-t-il des outils logiciels qui permettent de faire cela pour MacOS ?

10voto

nisetama Points 894

J'ai utilisé FastScripts pour attribuer un raccourci clavier à ces commandes :

screencapture -i /tmp/tesseract.png
tesseract /tmp/tesseract.png stdout|tr -d \\f|LC_CTYPE=UTF-8 pbcopy

brew install tesseract installe Tesseract. Tesseract imprime sur STDOUT lorsque le nom du fichier de sortie est spécifié en tant que stdout . Un caractère de saut de page est ajouté à la fin de la sortie.

Pour les textes non anglais, vous devez spécifier manuellement la langue : par exemple -l deu pour l'allemand. Pour obtenir la liste des langues disponibles, exécutez tesseract --list-langs .

Edit : Dans les cas où Tesseract produit des résultats inexacts, j'utilise maintenant l'API Cloud Vision de Google à la place. Démonstration : https://cloud.google.com/vision/docs/drag-and-drop .

curl -sH"Authorization:Bearer $(gcloud auth application-default print-access-token)" -HContent-Type:application/json\;charset=utf-8 https://vision.googleapis.com/v1/images:annotate -d@<(printf %s '{"requests":[{"image":{"content":"'"$(base64 input.png)"'"},"features":[{"type":"TEXT_DETECTION"}]}]}')|jq -r '.responses[0].fullTextAnnotation.text'

Edit 2 : Mon essai gratuit pour l'API Google a expiré, donc j'utilise maintenant Yandex Translate pour faire de l'OCR pour les images avec lesquelles Tesseract a des problèmes : https://translate.yandex.com/ocr .

Edit 3 : Vous pouvez faire cela pour traduire également le texte ( https://cloud.google.com/translate/docs/basic/translating-text ) :

curl -HAuthorization:Bearer\ $(gcloud auth application-default print-access-token) -HContent-Type:application/json -d@<(jq -sR '{q:.,target:"de"}'<<<example) https://translation.googleapis.com/language/translate/v2|jq -r '.data.translations[0].translatedText'

3voto

Varun Madiath Points 1440

TextSniper est une autre application qui permet l'OCR des captures d'écran. Elle reconnaît tout texte à partir d'une capture d'écran et copie le texte éditable dans le presse-papiers. Elle ne nécessite pas de connexion Internet et est très rapide. Une autre caractéristique intéressante de TextSniper est qu'il peut convertir le texte reconnu en parole, ce qui est très utile pour les personnes qui ont des difficultés à lire le texte à l'écran.

2voto

Frank Bollack Points 10208

J'ai récemment acheté Condenser (5 $ appstore), qui fait exactement ce que vous décrivez.

2voto

OWLOCR est une excellente application qui fait exactement ce que vous voulez et bien plus encore.

0voto

Frank Murphy Points 1

Je le fais avec LEADTOOLS OCR. Je ne l'ai pas beaucoup utilisé. C'est facile à utiliser. Je l'ai juste utilisé sur une image plus petite... une capture d'écran d'un livre avec les deux pages dans la prise de vue... cela a rendu le texte plus petit, contribuant à des erreurs.

Je ne sais pas si elle est encore disponible. Le copyright sur LEADTOOLS OCR est 1991-2014, et c'est la version 2.

Bonne chance !

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X