13 votes

Quelle est la différence et l'utilisation des encodages UTF-8 et UTF-8-MAC dans iconv ?

Quelle est la différence et l'utilisation des encodages UTF-8 et UTF-8-MAC dans iconv ?
Je pensais que c'était la différence entre \n y \r (MAC OS 9) au début.
Mais j'ai essayé iconv -f UTF-8 -t UTF-8-MAC filename > filename2
Le contenu du fichier ne change pas dans la vue hexagonale.

20voto

PATRY Points 3068

Comme expliqué aquí , utf-8-mac est la version utf 8 d'un texte après application de la normalisation Unicode NFD (par exemple, les caractères accentués sont représentés par le caractère de base plus un caractère accentuel de combinaison), avec certaines plages de points de code exclues de l'opération de décomposition.

Par exemple, le caractère é peut être représenté de deux manières différentes et également valides dans Unicode :

  • " \x {00E9}" - codepoint unique, LATIN SMALL LETTER E WITH ACUTE, utf-8 C3 A9, "composé".
  • " \x {0065} \x {0301}" - deux codepoints, LATIN SMALL LETTER E et COMBINING ACUTE ACCENT, utf-8 65 CC 81, "décomposé".

UTF-8-MAC veillera à ce que la deuxième forme, décomposée, soit toujours utilisée.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X