Quelle est la différence et l'utilisation des encodages UTF-8 et UTF-8-MAC dans iconv ?
Je pensais que c'était la différence entre \n y \r (MAC OS 9) au début.
Mais j'ai essayé iconv -f UTF-8 -t UTF-8-MAC filename > filename2
Le contenu du fichier ne change pas dans la vue hexagonale.
Réponse
Trop de publicités?Comme expliqué aquí , utf-8-mac est la version utf 8 d'un texte après application de la normalisation Unicode NFD (par exemple, les caractères accentués sont représentés par le caractère de base plus un caractère accentuel de combinaison), avec certaines plages de points de code exclues de l'opération de décomposition.
Par exemple, le caractère é peut être représenté de deux manières différentes et également valides dans Unicode :
- " \x {00E9}" - codepoint unique, LATIN SMALL LETTER E WITH ACUTE, utf-8 C3 A9, "composé".
- " \x {0065} \x {0301}" - deux codepoints, LATIN SMALL LETTER E et COMBINING ACUTE ACCENT, utf-8 65 CC 81, "décomposé".
UTF-8-MAC veillera à ce que la deuxième forme, décomposée, soit toujours utilisée.