3 votes

Comment obtenir le texte d'une page web depuis la ligne de commande ?

Je recherche l'équivalent en ligne de commande de l'option Extraire le texte de la page web dans /Applications/Automator.app. L'option Extraire le texte de la page web est assez explicite, elle récupère uniquement le texte, sans balises HTML, CSS, JavaScript, etc. d'une page web. Je sais que je peux utiliser wget ou curl mais cela me donnera toutes les balises HTML, CSS, JavaScript, etc. et non pas uniquement la version texte de la page web.

1voto

benwiggy Points 21125

Votre meilleure option est la commande textutil. Lisez la page de manuel, mais quelque chose comme :

textutil -convert txt webpage.html

devrait fonctionner.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X