Je veux pouvoir faire une capture d'écran sur mon Mac, puis l'envoyer à un moteur OCR et récupérer le texte qu'il a identifié.
Existe-t-il des outils logiciels qui permettent de faire cela pour MacOS ?
Je veux pouvoir faire une capture d'écran sur mon Mac, puis l'envoyer à un moteur OCR et récupérer le texte qu'il a identifié.
Existe-t-il des outils logiciels qui permettent de faire cela pour MacOS ?
J'ai utilisé FastScripts pour attribuer un raccourci clavier à ces commandes :
screencapture -i /tmp/tesseract.png
tesseract /tmp/tesseract.png stdout|tr -d \\f|LC_CTYPE=UTF-8 pbcopy
brew install tesseract
installe Tesseract. Tesseract imprime sur STDOUT lorsque le nom du fichier de sortie est spécifié en tant que stdout
. Un caractère de saut de page est ajouté à la fin de la sortie.
Pour les textes non anglais, vous devez spécifier manuellement la langue : par exemple -l deu
pour l'allemand. Pour obtenir la liste des langues disponibles, exécutez tesseract --list-langs
.
Edit : Dans les cas où Tesseract produit des résultats inexacts, j'utilise maintenant l'API Cloud Vision de Google à la place. Démonstration : https://cloud.google.com/vision/docs/drag-and-drop .
curl -sH"Authorization:Bearer $(gcloud auth application-default print-access-token)" -HContent-Type:application/json\;charset=utf-8 https://vision.googleapis.com/v1/images:annotate -d@<(printf %s '{"requests":[{"image":{"content":"'"$(base64 input.png)"'"},"features":[{"type":"TEXT_DETECTION"}]}]}')|jq -r '.responses[0].fullTextAnnotation.text'
Edit 2 : Mon essai gratuit pour l'API Google a expiré, donc j'utilise maintenant Yandex Translate pour faire de l'OCR pour les images avec lesquelles Tesseract a des problèmes : https://translate.yandex.com/ocr .
Edit 3 : Vous pouvez faire cela pour traduire également le texte ( https://cloud.google.com/translate/docs/basic/translating-text ) :
curl -HAuthorization:Bearer\ $(gcloud auth application-default print-access-token) -HContent-Type:application/json -d@<(jq -sR '{q:.,target:"de"}'<<<example) https://translation.googleapis.com/language/translate/v2|jq -r '.data.translations[0].translatedText'
TextSniper est une autre application qui permet l'OCR des captures d'écran. Elle reconnaît tout texte à partir d'une capture d'écran et copie le texte éditable dans le presse-papiers. Elle ne nécessite pas de connexion Internet et est très rapide. Une autre caractéristique intéressante de TextSniper est qu'il peut convertir le texte reconnu en parole, ce qui est très utile pour les personnes qui ont des difficultés à lire le texte à l'écran.
J'ai récemment acheté Condenser (5 $ appstore), qui fait exactement ce que vous décrivez.
OWLOCR est une excellente application qui fait exactement ce que vous voulez et bien plus encore.
Je le fais avec LEADTOOLS OCR. Je ne l'ai pas beaucoup utilisé. C'est facile à utiliser. Je l'ai juste utilisé sur une image plus petite... une capture d'écran d'un livre avec les deux pages dans la prise de vue... cela a rendu le texte plus petit, contribuant à des erreurs.
Je ne sais pas si elle est encore disponible. Le copyright sur LEADTOOLS OCR est 1991-2014, et c'est la version 2.
Bonne chance !
LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.