data.language
data.language définit la gamme des valeurs d'attributs employés pour identifier une combinaison particulière du langage humain avec un système d'écriture vi.1. Language identification | |
Module | tei — 1 The TEI Infrastructure |
Utilisé par |
Classe:
Elément:
|
Declaration |
data.language = xsd:language |
Note |
Les valeurs pour cet attribut sont les ‘étiquettes’ de langue définies
dans la normeBCP 47. Actuellement, la norme BCP 47
intègre les normes RFC 4646 et RFC 4647 ; à l'avenir, d'autres documents de l'IETF pourront leur succéder en
tant que meilleure pratique du moment.
Une ‘étiquette de langue’, pour la norme BCP 47, est formée par l'assemblage d'une
suite de composants ou de sous-étiquettesreliés par un trait d'union
(-, U+002D). L'étiquette est composée des sous-étiquettes suivantes,
dans l'ordre indiqué. Chaque sous-étiquette est facultative, à l'exception de la première.
Chacune ne peut avoir qu'une occurrence, sauf les quatrième et cinquième (variante
et extension), qui sont répétables.
Il y a deux exceptions au format ci-dessus. Premièrement, il y a des codes de langue dans
le registre de l'IANA
qui ne correspondent pas à la syntaxe ci-dessus, mais qui sont présents car ils ont été
‘hérités’de spécifications antérieures.
En second lieu, une étiquette complète de langue peut consister seulement en une sous-étiquette d'usage privé. Ces étiquettes
commencent par x- ; il n'est pas
nécessaire qu'elles suivent aucune des autres règles établies par l'IETF et acceptées par les présents
Principes directeurs. Comme toutes les étiquettes de langue qui utilisent des sous-étiquettes d'usage
privé, la langue en question doit être documentée dans un élément correspondant language dans l'en-tête TEI.
Les exemples incluent
La W3C Internationalization Activity a publié une introduction à la norme BCP 47 dont la lecture peut être utile : Language
tags in HTML and XML.
|