data.language

data.language définit la gamme des valeurs d'attributs employés pour identifier une combinaison particulière du langage humain avec un système d'écriture vi.1. Language identification
Module tei — 1 The TEI Infrastructure
Utilisé par
Classe:
Elément:
Declaration

<rng:define name="data.language">
 <rng:data type="language"/>
</rng:define>
data.language = xsd:language
Note
Les valeurs pour cet attribut sont les ‘labels’ de langue définis dans la normeBCP 47. Actuellement, la BCP 47 comprend la RFC 4646 et la RFC 4647 ; à l'avenir, d'autres documents de l'IETF pourront leur succéder en tant que meilleure pratique du moment.
Un‘label de langue’,pour la BCP 47, est formé par l'assemblage d'une suite de composants ou de sous labelsreliés par un trait d'union (-, U+002D). Le label est composée des sous labels suivants, dans l'ordre suivant. Chque sous label est facultatif, à l'excpetion du premier. Chacun ne peut avoir qu'une occurrence, sauf les quatrième et cinquième composants, (variante et extension), qui sont répétables.
langue
Code de langue enregistré par l'IANA. Il est presque toujours identique au code de langue alphabétique ISO 639 2 s'il y en a un. La liste des sous labels de langue enregistrés est disponible sur : http://www.iana.org/assignments/language-subtag-registryIl est recommandé d'écrire ce code en minuscules.
écriture
Code ISO 15924 pour l'écriture. Ces codes sont constitués de 4 lettres, et il est recommandé d'écrire la première lettre en majuscule, les trois autres en minuscules. La liste canonique des codes est maintenue par le Consortium Unicode, et elle est disponible sur : http://unicode.org/iso15924/iso15924-codes.html. L'IETF recommande d'omettre ce code, sauf s'il est nécessaire pour établir une distinction..
région
Soit un code de pays ISO 3166 soit un code de région UN M.49 enregistré par l'IANA (tous les codes de ce type ne sont pas enregistrés ; par exemple ne sont pas enregistrés les codes UN pour des regroupements économiques ou les codes de pays pour lesquels il existe déjà un code pays alphabétique ISO 3166 2). Le premier est constitué de 2 lettres, et il est recommandé de l'écrire en majuscules. La liste des codes est disponible sur : http://www.iso.org/iso/en/prods-services/iso3166ma/02iso-3166-code-lists/index.html. Le second est constitué de 3 chiffres ; la liste des codes est disponible sur : http://unstats.un.org/unsd/methods/m49/m49.htm.
variante
Variante enregistrée par l'IANA. Ces codes ‘sont utilisés pour indiquer des variantes additionnelles et bien établies, qui définissent une langue ou ses dialectes et qui ne sont pas couverts par d'autres sous labels existants’.
extension
Une extension a la forme d'une lettre unique, suivie d'un trait d'union suivie de sous labels additionnels. Ces dernièrs existent pour tenir compte d'une future extension de BCP 47, mais à l'heure actuelle de telles extensions ne sont pas utilisées.
usage privé
Une extension utilisant le sous label initial de la lettre x (i.e., commence parx-) n'a pas d'autre signification que celle négociée entre les parties impliquées. Elles doivent être utilisées avec beaucoup de prudence, car elles interfèrent avec l'interopérabilité que l'utilisation de RFC 4646 vise à promouvoir. Pour qu'un document qui utilise ces sous labels soit conforme à la TEI, un élément language correspondant doit être présent dans l'en-tête TEI.
Il y a deux exceptions au format ci-dessus. Premièrement, il y a des codes de langue dans leregistre de l'IANA qui ne correspondent pas à la syntaxe ci-dessus, mais qui sont présents car ils ont été ‘hérités’de spécifications antérieures.
En second lieu, un label de langue entier peut consister seulement en un sous label d'usage privé. Ces labels commencent par x-, et il n'est pas nécessaire qu'ils suivent aucune des autres règles établies par l'IETF et acceptées par ces Recommandations. Comme tous les labels de langue qui utilisent des sous labels d'usage privé, la langue en question doit être documentée dans un élément correspondantlanguage dans l'en-tête TEI.
Les exemples incluent
sn
Shona
zh-TW
Taiwanais
zh-Hant-HK
Chinois de Hong Kong écrit dans l'écriture traditionnelle
en-SL
Anglais parlé au Sierra Leone
pl
Polonais
es-MX
Espagnol parlé au Mexique
es-419
Espagnol parlé en Amérique latine
La W3C Internationalization Activity a publié une introduction utile à la norme BCP 47, Language tags in HTML and XML.