26 votes

Comment puis-je transformer un fichier Webarchive de Safari en un dossier ?

Je comprends qu'une webarchive Safari est un seul fichier avec le code source et d'autres ressources d'une page web concaténées dans un seul fichier. J'ai trouvé un article de Macworld de 2006 décrivant un programme qui fait exactement cela, mais le lien vers le programme n'est plus d'actualité.

Y a-t-il actuellement un logiciel disponible qui peut convertir un fichier webarchive Safari dans un format plus standard?

21voto

Ivan Chau Points 686

Existe-t-il un logiciel actuellement disponible qui peut convertir un fichier webarchive Safari dans un format plus standard?

Si vous êtes à l'aise avec la ligne de commande, il y a un outil textutil sur Mac OS pour convertir un fichier webarchive en txt, html, rtf, rtfd, doc, docx, wordml ou odt.

Exemple:
textutil -convert html /Users/USERNAME/NAME.webarchive


Pour convertir un fichier webarchive en pdf, essayez "Wondershare PDF Editor for Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

11 votes

Le outil en ligne de commande textutil extrait uniquement le fichier HTML de premier niveau, et non pas le CSS ou les scripts qui font également partie de l'archiveweb. (Ce qui est vraiment tout l'intérêt de l'archiveweb.) Je n'ai pas trouvé de bonne alternative pour faire cela en ligne de commande.

2 votes

@Stephen WebArchiveExtractor dispose d'une action Automator qui peut être scriptée via le shell.

0 votes

Malgré les avertissements, c'est le genre de réponse que je cherchais. Une solution basée sur une interface graphique est assez inutile lorsque vous voulez convertir des centaines de webarchives sur un serveur.

15voto

grg Points 181593

WebArchiveExtractor

Je recommande WebArchiveExtractor. Vous pouvez faire glisser des fichiers .webarchive vers cette application qui extraira le fichier dans ses fichiers individuels dans un dossier.

Vous pouvez personnaliser la sortie dans les Préférences, y compris en définissant un nom de fichier d'index personnalisé :

WebArchiveExtractor est open source sur GitHub

À partir de juin 2021, il se compile parfaitement dans Xcode (à partir du lien ci-dessus) et fonctionne très bien.

0 votes

WebArchive Extractor ne fonctionne pas pour moi depuis le 9 décembre 2019. J'utilise macOS 10.14.4 (18E226) Mojave sur un fichier .webarchive de Safari.

1 votes

Il semble en effet fonctionner parfaitement depuis juin 2021, merci pour le conseil ici !

1 votes

Il fonctionne parfaitement à partir du 20 juin 2020, essayez ce lien github.com/robrohan/WebArchiveExtractor/releases

2voto

GummyArgyle Points 2713

Il y a actuellement un logiciel. Le logiciel est presque le même que celui dans le lien que vous avez fourni.

https://www.macupdate.com/app/mac/20643/webarchive-folderizer

Mac OS X 10.2 ou ultérieur : Intel / PPC

1 votes

Cela a très bien fonctionné pour moi sur El Capitan.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X