Les jeux de caractères

L'essentiel...

Le jeu de caractères est très dépendant du système d'exploitation utilisé. En effet, un fichier texte généré par le système MS-DOS par exemple, n'aura pas le même codage interne qu'un fichier texte généré par le système Windows, même s'il contient des caractères identiques. Ceci peut se révéler problématique si vous essayez d'importer un fichier texte créé sous MS-DOS, car ça provoquera l'affichage de caractères parasites sous Windows, du fait des codages différents (un code de caractère sous DOS ne sera pas forcément le même sous Windows).

Ce cas de figure se produira généralement lorsque le fichier texte créé sous DOS contient des caractères spéciaux tels que des caractères accentués, des symboles graphiques ou monétaires, etc... En effet, à l'époque des premiers ordinateurs sous DOS, les graphismes étaient inexistants, et la seule manière d'en afficher consistait à saisir des caractères particuliers, tels que des carrés, des traits horizontaux ou verticaux, etc... L'agencement de ces caractères permettait d'obtenir des graphismes sommaires.

Avec l'arrivée des systèmes d'exploitation à interface graphique tel que Windows, cette caractéristique est devenue obsolète et les caractères graphiques ont perdu leur intérêt. Ils ont donc été remplacés par des caractères accentués supplémentaires, ainsi que par d'autres symboles commerciaux (par exemple : "®", "Ö", etc...).

Seulement, la table utilisée pour représenter les caractères n'était pas extensible. C'est pourquoi les caractères introduits par Windows sont venus "écraser" les caractères de MS-DOS jugés obsolètes, provoquant ainsi l'affichage de caractères différents sous ces 2 systèmes pour un texte identique, si ce dernier contient des caractères accentués ou graphiques. Une conversion est donc nécessaire si le caractère existe dans les 2 tables, mais à un endroit différent. Cette conversion sera inefficace si le caractère utilisé sous DOS n'existe pas sous Windows.

Si le texte ne contient que des chiffres et minuscules ou majuscules non accentuées, l'affichage sera identique sous les 2 systèmes, car la représentation interne de ces caractères est identique. Toute conversion sera alors inutile.

Le nom utilisé pour la table des caractères de MS-DOS est ASCII étendu, ou plus généralement, ASCII.

Sous Windows, cette table se nomme ANSI.