Paramètres régionaux

Les paramètres régionaux, aussi appelés paramètres de lieu, environnement linguistique, options régionales et linguistiques, ou même culture ou locales (terme anglais), sont un ensemble de définitions de textes et de formats utiles à la régionalisation de logiciel. Ceux-ci permettent au logiciel d’afficher les données selon les attentes culturelles et linguistiques propres à la langue et au pays de l’utilisateur :

Habituellement, les identificateurs de culture consistent au moins en un identificateur de langue et un identificateur de région.

Les identificateurs de culture peuvent être définis de différentes manières :

  • Locale Identifier (LCID) pour le code non-CLI (unmanaged code) sur Microsoft Windows est un nombre tel que « 1033 » pour l'anglais (des États-Unis d'Amérique) ou « 1041 » pour le japonais (du Japon) ; ces nombres consistent en un code de langue (10 bits de poids faible) et un code de culture (bits de poids forts) et sont donc souvent notés en hexadecimal, tels que 0x0409 ou 0x0411 ;
  • en XML, Microsoft .NET, Java et autres environnements basés sur Unicode, les identificateurs de culture sont définis sur un format similaire au RFC 3066 ou l'un de ces successeurs ; ils sont habituellement définis avec seulement les codes ISO 639 et ISO 3166-1 alpha-2 ;
  • sur Unix, Linux et autres plateformes de type POSIX, les identificateurs de culture sont définis conformément à la définition RFC 3066, mais le modificateur de variable locale est défini différemment, et le charset est inclus dans l'identificateur ; il est défini dans ce format : [language[_territory][.codeset][@modifier]] (par exemple : fr_FR.UTF-8).

Codage des caractères[modifier | modifier le code]

Les paramètres régionaux, sous Windows comme sous Linux, indiquent quels sont les codages de caractères à utiliser. Chaque système a ses spécificités liées à une évolution différente.

Windows s'est construit sur une base DOS, à laquelle s'est d'abord ajoutée une API 8 bits, puis une API dite Unicode. De ce fait, ce système peut utiliser à un même moment trois jeux de caractères, qui en Europe de l'Ouest sont : la page de code 850 en ligne de commande, Windows-1252 dans les applications anciennes et Unicode dans les applications modernes.

Linux s'est construit sur un héritage Unix, où le codage régional de caractère a été progressivement remplacé par UTF-8 par défaut, qui couvre le monde entier. Cela s'est fait progressivement, d'abord avec Red Hat Linux 8.0 (en , sauf dans les pays asiatiques). À la suite de certaines corrections, SuSE Linux version 9.1 (en ) puis Ubuntu Linux, sont également passés à un préréglage UTF-8[2].

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Références[modifier | modifier le code]

  1. « docs.microsoft.com »
  2. « UTF-8 and Unicode FAQ », sur cl.cam.ac.uk (consulté le ).