Document numérique
Lavoisier

I.S.B.N.sans
240 pages

p. 51 à 88
doi: 10.3166/dn.6.3-4.51-88

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 6 2002/3-4

Introduction à Unicode et à l’ISO 10646

Patrick Andries
Cet article présente les points saillants de la version 3.2 du standard Unicode et son pendant ISO, la norme internationale ISO/CEI 10646. L’article répond tout d’abord à quelques questions fréquentes : qu’est-ce qui a poussé au développement de cette norme ? Quels en sont les principes de conception ? Quels caractères normalise-t-elle ? Qu’est-ce qu’un caractère, un glyphe ? Comment doit-on coder les suites de caractères, les caractères accentués ? Suit un bref examen du modèle de codage des caractères et des formes normalisées de représentation des données. Enfin l’article conclut par une description de deux processus fondamentaux et leur rapport avec Unicode : le tri et le rendu.
résumé en cri Mots-clés : Unicode, ISO/CEI10646, formes normalisées, modèle de caractères, principes de conception, écritures, alphabets, glyphe, caractère, tri, rendu, polices, OpenType, .
This article presents a concise overview of Unicode 3.2 and its ISO equivalent, ISO/IEC 10646. It introduces and summarizes the main features and design principles before examining the character encoding model, normalizations forms and common processes such as sorting and rendering and their relationship with Unicode.Keywords : Unicode, ISO/IEC 10646, normalisation forms, character model, design principles, glyphs, collation, rendering, fonts, OpenType.
• Introduction
— Pourquoi Unicode ?
— Principes directeurs
— La norme ISO/CEI 10646 et le standard Unicode
• Quels caractères Unicode et l’ISO/CEI 10646 normalisent-ils ?
• Caractères
— Caractère abstrait, caractère codé et glyphe
— Caractères combinatoires et diacritiques
— Suite de caractères de base et diacritiques
— Caractères combinatoires multiples
• Principes de conception du standard Unicode
— Universalité
— Efficacité
— Caractères et non glyphes
— Sémantique
— Texte brut
— Ordre logique
— Unification
— Composition dynamique
— Séquence équivalente
— Convertibilité
• Le standard Unicode : mode d’emploi
— Liste des noms de caractère
— Images dans les tableaux de codes et dans les listes de caractères
— Renvois
— Renseignements sur les langues
— Décompositions
• Modèle de codage des caractères
— Répertoire de caractères abstraits
— Jeu de caractères codés
— Forme en mémoire des caractères
— Mécanisme de sérialisation de caractères
• Formes normalisées
• Ordonnancement et tri lexicographique
• Rendu
— Deux espaces distincts
— Processus de rendu et polices
• Bibliographie


© Cairn.info 2009 Vie privée | Conditions d’utilisation | Conditions générales de vente
Cairn.info | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis