La TEI Lite : encoder pour échanger : une introduction à la TEI
Edition finale révisée pour la TEI P5
Lou Burnard et C. M. Sperberg-McQueen
traduction française de Sophie David
Paris, avril 2013

Note liminaire

TEI Lite est le nom adopté pour ce que les éditeurs de la TEI avaient conçu au départ comme un simple exposé du schéma d’encodage, en tant qu’il pouvait traiter 90% des besoins de 90% des utilisateurs. Rétrospectivement, il était assez prévisible que beaucoup de gens allaient penser que la TEI Lite constituait toute la TEI, ou allaient trouver que TEI Lite était bien trop lourde pour leurs besoins.

La TEI Lite, à l’origine (1996), était largement fondée sur l’observation des pratiques d’encodage des textes, en particulier celles qui ont été mises en œuvre pour les collections d'Oxford Text Archive ou bien pour d’autres de la même époque. Il n’est donc pas surprenant qu’elle soit devenue, sinon un standard, du moins un point de départ pour des centres d’édition électronique ou des projets d’encodage, et ce dans le monde entier. Sans doute, la production de ce court manuel, facile à lire, y aura aussi contribué.

Un certain nombre de centres d’édition électronique et des projets de bibliothèques numériques ont été les premiers intéressés à la TEI Lite. Celle-ci a également été adoptée par quelques systèmes auteur, et par des tutoriels d’introduction, beaucoup d’entre eux étant rédigés dans des langues autres que l’anglais (une liste des versions précédentes peut être consulteé à : http://www.tei-c.org/Lite/)

En 2002, après la publication de la TEI version 4 (désormais TEI P4), soit la version XML des Recommandations (TEI Guidelines), qui utilisait la génération de la TEI Lite comme un exemple de mécanisme de modification de la TEI, une version légèrement révisée et se conformant désormais à XML, a été produite. Puis, en 2006, a été publiée une version remaniée de manière plus substantielle, fondée sur les Recommandations de la version 5 (désormais TEI P5). Cette version reflétait les nombreux changements entre TEI P4 et TEI P5, mais n’était pas par ailleurs notablement différente. En 2012, le TEI Technical Council a décidé qu’une nouvelle version devait être produite, de telle sorte que la documentation demeure cohérente avec la dernière version de TEI P5 (2.1.) Cette version a recours à un mécanisme récemment ajouté dans l’architecture générale, qui permet de définir uniquement les éléments qui sont à inclure dans un schéma (et non plus ceux qui sont à exclure). Il est ainsi probable qu'elle resiste mieux que les versions précédentes aux évolutions futures de la TEI .

Lou Burnard, août 2012

Table des matières

Ce document constitue une introduction aux Recommandations de la Text Encoding Initiative (TEI). Il décrit un sous-ensemble spécifique du schéma complet TEI. Il peut être utilisé pour encoder une grande variété de caractéristiques textuelles courantes, ce qui permet d’une part de maximiser l’utilisation (et la réutilisation) de transcriptions électroniques et d’autre part de faciliter les échanges entre des chercheurs utilisant des ordinateurs de systèmes différents. Ce schéma est entièrement compatible avec le schéma complet TEI, tel que celui-ci est défini dans TEI P5, Guidelines for Electronic Text Encoding and Interchange, février 2006, documents disponibles sur le site web du Consortium :http://www.tei-c.org

1 Introduction

Les Recommandations de la Text Encoding Initiative (TEI) s’adressent à tous ceux qui souhaitent échanger des informations stockées sous forme électronique. Elles mettent l’accent sur l’échange d’informations textuelles, mais d’autres types de données, tels que les images et les sons, sont également pris en compte. Les Recommandations s’appliquent aussi bien à la création de nouvelles ressources qu’aux échanges de ressources existantes.

Les Recommandations fournissent les moyens de rendre explicites certaines caractéristiques d’un texte, de façon à faciliter le traitement de ce texte par des logiciels fonctionnant sur des plateformes différentes. Cette tâche d’explicitation est appelée balisage ou encodage. Toute représentation textuelle met en jeu une forme ou une autre de balisage ; la TEI a été créée en partie pour résoudre les questions d’incommunicabilité entre ces formats d’encodage, et en partie à cause de l’éventail toujours plus diversifié et toujours plus important des usages scientifiques des textes électroniques.

Les Recommandations de la TEI décrivent un schéma d’encodage, qui peut s’exprimer dans différents langages formels. Dans les premières éditions, les Recommandations utilisaient SGML (Standard Generalized Markup Language) ; depuis 2002, celui-ci a été remplacé par XML (Extensible Markup Language). Ces langages partagent en commun la capacité de pouvoir définir un texte en termes d’éléments, d’attributs, et de règles régissant leur apparence dans un texte. L’utilisation que la TEI fait de XML est ambitieuse dans sa complexité et dans sa généralité. Mais elle n’est pas fondamentalement différente de tous les autres schémas XML proposés. N’importe quel logiciel fondé sur un XML généraliste peut ainsi traiter des textes conformes à la TEI.

Depuis 2001, la TEI est un projet collectif s’appuyant sur un consortium international. Au départ, il s’agissait d’un projet de recherche soutenu par l’Association for Computers and the Humanities, l’Association for Computational Linguistics, et l’Association for Literary and Linguistic Computing. Il a été financé ses cinq premières années par le U.S. National Endowment for the Humanities, le Directorate General XIII of the Commission of the European Communities, la Fondation Andrew W. Mellon, le Social Science and Humanities Research Council of Canada entre autres. Les Recommandations ont été publiées la première fois en mai 1994, après 6 ans de travaux impliquant de nombreux chercheurs du monde entier, issus de différentes disciplines.

Durant les années qui ont suivi, les Recommandations ont eu beaucoup d’influence dans le développement des bibliothèques numériques, dans le domaine des industries de la langue, et même dans le développement du web lui-même. Le Consortium TEI a été mis en place en janvier 2001. Une année plus tard, il publiait des Recommandations entièrement révisées, et désormais fondées sur XML. En 2004, le Consortium procédait à une refonte majeure des Recommandations, pour tirer pleinement parti des nouveaux langages à schéma. Une première version a été publiée en 2005. La révision du document TEI Lite est conforme à la version 2.1. des Recommandations, soit la version TEI P5 la plus récente, qui est sortie en juin 2012.

A l’origine, les objectifs généraux de la TEI ont été définis par la résolution finale de la conférence préparatoire, qui s’est tenue au Vassar College (New-York), en novembre 1987. Ces « Principes de Poughkeepsie » ont été ensuite précisés dans une série de documents, qui établissaient notamment que les Recommandations, devaient :

Le monde de la recherche est vaste et divers. Pour que les Recommandations suscitent une large adhésion, il était important de s’assurer que :

  1. le noyau commun de caractéristiques textuelles soit facile à partager ;
  2. des traits spécialisés soient faciles à ajouter (ou à supprimer) ;
  3. des encodages multiples et parallèles d’une même caractéristique soient possibles ;
  4. la richesse du balisage puisse être déterminée par l’utilisateur, et ce, avec un minimum de connaissances ;
  5. une documentation pertinente relative au texte et à son encodage soit fournie.

Le présent document, qui se nomme TEI Lite, décrit un sous-ensemble des éléments et des recommandations de la TEI, qui ont été établis à partir des objectifs et des principes rappelés ci-dessus.

Avec la sélection opérée parmi les centaines d’éléments définis dans le schéma TEI complet, nous nous sommes efforcés d’identifier un sous-ensemble, comprenant des éléments que (presque) tous les utilisateurs devraient connaître.

Ce sous-ensemble doit répondre aux objectifs suivants :

Le lecteur jugera jusqu'à quel point nous avons realisé ces objectifs.

Bien que nous ayons essayé de rendre ce document indépendant, tel que l’est un tutoriel, le lecteur doit être conscient qu’il ne décrit pas en détail la totalité de la TEI. Tous les éléments décrits ici sont entièrement documentés dans les Recommandations. Celles-ci constituent la documentation de référence, qui doit être consultée aussi bien pour les éléments décrits ici que pour tous les autres qui ne sont pas décrits. On suppose que le lecteur a un savoir de base à propos de XML.

2 Un court exemple

Nous commençons par un bref exemple1 Son but est d’illustrer ce qui se passe quand un passage en prose est saisi sur ordinateur par une personne qui n’est pas au fait du balisage ou du potentiel des textes électroniques. Dans un monde idéal, un tel résultat pourrait être généré par un scanner optique très précis. Il tente de rester fidèle à l’apparence du texte imprimé, en retenant les mêmes fins de lignes que l’original, en insérant des blancs pour représenter la disposition des titres originaux et les fins de page, et ainsi de suite, et en gardant la ponctuation originelle.

Transcription naive d'un texte imprimé
Figure 1. Transcription naive d'un texte imprimé

Cette transcription présente quelques défauts :

Nous présentons maintenant le même passage, avec un encodage conforme aux Recommandations. Comme nous allons le voir, cet encodage pourrait être étendu de bien des façons, mais la TEI nous permet, au minimum, de représenter les distinctions suivantes :

<pb n="239"/>
<div n="XXXVIIItype="chapitre">
 <head rend="petitMajuscules">conclusion.</head>
 <p>J’ai enfin épousé M. Rochester. Notre mariage se fit sans bruit; lui, moi, le
   ministre et le clerc, étions seuls présents. Quand nous revînmes de l’église, j’entrai
   dans la cuisine, où Marie préparait le dîner, tandis que John nettoyait les couteaux. </p>
 <p> «<q>Marie</q>, dis-je, <q>j’ai été mariée ce matin à M. Rochester.</q> » </p>
 <p>La femme de charge et son mari appartenaient à cette classe de gens discrets et
   réservés auxquels on peut toujours communiquer une nouvelle importante sans crainte
   d’avoir les oreilles percées par des exclamations aiguës, ni d’avoir à supporter un
   torrent de surprises. Marie leva les yeux et me regarda. Pendant quelques minutes elle
   tint suspendue en l’air la cuiller dont elle se servait pour arroser deux poulets qui
   cuisaient devant le feu, et John cessa de polir ses couteaux. Enfin Marie, se penchant
   vers son rôti, me dit simplement : </p>
 <p>« <q>En vérité, mademoiselle ? Eh bien, tant mieux, certainement.</q> » </p>
 <p>Au bout de quelque temps elle ajouta : « <q>Je vous ai bien vue sortir avec mon
     maître ; mais je ne savais pas que vous alliez à l’église pour vous marier.</q> » </p>
 <p>Et elle continua d’arroser son rôti. </p>
 <p>Quand je me tournai vers John, je vis qu’il ouvrait la bouche si grande qu’elle
   menaçait d’aller rejoindre ses oreilles. </p>
 <p> « <q>J’avais bien averti Marie que cela arriverait,</q> dit-il. <q>Je savais que M.
     Édouard</q> (John était un vieux serviteur et avait connu son maître alors qu’il
   était encore cadet de famille ; c’est pourquoi il l’appelait souvent par son nom de
   baptême), <q>je savais que M. Édouard le ferait, et j’étais persuadé qu’il
     n’attendrait pas longtemps ; je suis sûr qu’il a bien fait.</q> » </p>
 <p>En disant ces mots, John tira poliment ses cheveux de devant. </p>
 <p> « <q>Merci, John,</q> répondis-je. <q>Tenez, M. Rochester m’a dit de vous donner
     ceci, à vous et à Marie.</q> » Et je lui remis un billet de cinq livres. </p>
 <p> Sans plus attendre je quittai la cuisine. Quelque temps après, en repassant devant
   la porte, j’entendis les mots suivants : </p>
 <p> « <q>Elle lui conviendra mieux qu’une grande dame.</q> » Puis : « <q>Il <pb n="240"/> y en a de plus jolies, mais elle est bonne et n’a pas de défauts. Du reste, il
     est facile de voir qu’elle lui semble bien belle.</q> » </p>
 <p> J’écrivis immédiatement à Moor-House, pour annoncer ce que j’avais fait. Je donnai
   toutes les explications nécessaires dans ma lettre. Diana et Marie m’approuvèrent
   entièrement. Diana m’annonça qu’elle viendrait me voir après la lune de miel. </p>
 <p> « <q>Elle ferait mieux de ne pas attendre jusque-là, Jane,</q> me dit M. Rochester,
   lorsque je lui lus la lettre ; <q>car la lune de miel brillera sur toute notre vie, et
     ses rayons ne s’éteindront que sur votre tombe ou sur la mienne.</q> » </p>
 <p>...</p>
</div>

L’encodage ci-dessus a été construit sur un ensemble de choix et de priorités : nous avons ici considéré que le texte de Brontë en tant que tel était plus important que son édition. Nous avons ainsi supprimé le tiret de césure, sans pour autant l’avoir marqué (cf. par exemple « de de-vant » dans l’édition, « de devant » dans l’encodage). Encoder c’est donc toujours faire des choix. Un encodage explicite seulement les caractéristiques textuelles qui importent à l’encodeur. Et il est facile d’imaginer différentes manières d’étendre l’encodage d’un passage même aussi court. Par exemple :

L’encodage de la plupart de ces extensions est décrit dans la suite du document. Le schéma TEI dans sa totalité fournit également un large éventail d’autres possibilités. Nous en citerons uniquement quelques-unes :

Pour savoir comment procéder dans ces différents cas, mais aussi pour connaître beaucoup d’autres possibilités, on se reportera aux Recommandations.

3 La structure d’un texte TEI

Tous les textes qui se conforment à la TEI comprennent : (a) un en-tête TEI (balisé avec l’élément teiHeader) (b) la transcription du texte (balisé avec l’élément text). Ces deux éléments sont associés pour former un seul élément TEI, qui doit être déclaré dans l’espace de noms TEI2.

L’en-tête TEI fournit des informations analogues à celles de la page de titre d’un texte imprimé. Il comporte au plus 4 parties :

L’en-tête est décrit de manière détaillée dans la section 19 La page titre électronique.

Un document TEI peut être unitaire (une œuvre) ou composite (un recueil d’œuvres, comme une anthologie). Dans les deux cas, le texte peut comporter des Parties liminaires ou des Annexes. Entre les deux, se trouve le corps du texte. Dans un texte composite, le corps peut rassembler des groupes, chaque groupe contenant d’autres groupes ou des textes.

Un texte unitaire sera encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!-- [ en-tête ] -->
 </teiHeader>
 <text>
  <front>
<!-- [ partie préliminaire ... ] -->
  </front>
  <body>
<!-- [ corps du texte ... ] -->
  </body>
  <back>
<!-- [ partie annexe ... ] -->
  </back>
 </text>
</TEI>
Un texte composite peut également comporter des Parties liminaires ou des Annexes. Entre les deux, on aura un ou plusieurs groupes de textes, chaque groupe pouvant avoir ses propres Parties liminaires et ses Annexes. Un texte composite sera alors encodé en utilisant une structure comme celle-ci :
<TEI xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!--[ en-tête du texte composite ]-->
 </teiHeader>
 <text>
  <front>
<!--[ partie préliminaire du texte composite ]-->
  </front>
  <group>
   <text>
    <front>
<!--[ partie préliminaire du premier texte ]-->
    </front>
    <body>
<!--[ corps du premier texte ]-->
    </body>
    <back>
<!--[ annexe du premier texte ]-->
    </back>
   </text>
   <text>
    <front>
<!--[ partie préliminaire du deuxième texte ]-->
    </front>
    <body>
<!--[ corps du deuxième texte ]-->
    </body>
    <back>
<!--[ annexe du deuxième texte ]-->
    </back>
   </text>
<!--[ encore de textes, simples ou composites ]-->
  </group>
  <back>
<!--[ annexe du texte composite ]-->
  </back>
 </text>
</TEI>
Il est aussi possible de définir un texte composite rassemblant des textes TEI complets, chacun d’entre eux étant pourvu de son propre en-tête. Un tel recueil est appelé TEI Corpus, et peut avoir son propre en-tête:
<teiCorpus xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!--[en-tête du corpus]-->
 </teiHeader>
 <TEI>
  <teiHeader>
<!--[en-tête du premier texte]-->
  </teiHeader>
  <text>
<!--[premier texte du corpus]-->
  </text>
 </TEI>
 <TEI>
  <teiHeader>
<!--[en-tête du deuxième texte]-->
  </teiHeader>
  <text>
<!--[deuxième texte du corpus]-->
  </text>
 </TEI>
</teiCorpus>

Il est également possible de créer un ensemble de corpus - un élément teiCorpus peut contenir d’autres éléments teiCorpus plutôt que des éléments TEI, et ce quelle que soit la profondeur.

Dans la suite du document, nous discuterons surtout des structures textuelles simples. Dans chaque cas, nous présenterons a) les éléments TEI pertinents, avec pour chacun une brève définition ; b) les attributs spécifiques de chaque élément, et leur définition ; c) la référence à la classe dont l’élément est un membre. Ces références sont associées aux spécifications complètes de chaque objet, comme cela est présenté dans les Recommandations. La plupart des cas sont illustrés par de brefs exemples.

Par exemple, voici les éléments dont on a discuté jusqu’à maintenant :

4 L’encodage du corps du texte

Comme nous l’avons indiqué, un document TEI simple rassemble les éléments suivants :

Les éléments traitant spécifiquement des Parties liminaires et des Annexes sont décrits ci-dessous dans la section 18 Les Parties liminaires et les Annexes. Dans cette section, nous discutons des éléments constituant le corps d’un texte.

4.1 Les éléments marquant la division du texte

Le corps d’un texte en prose peut être une simple suite de paragraphes ; ou bien, ces paragraphes peuvent être regroupés en chapitres, sections, sous-sections, etc. Chaque paragraphe est balisé par la balise p. L’élément div indique un regroupement de paragraphes.

On utilise l’attribut type de l’élément div pour indiquer la dénomination usuelle de la division, ou sinon pour distinguer plusieurs divisions. Typiquement, ses valeurs sont « livre », « chapitre », « section », « partie », « poème », « chanson », etc. Dans un projet particulier, il est conseillé de définir la liste des valeurs possibles et de s’y tenir.

Un élément div peut contenir des div enchâssés, reflétant ainsi la structure traditionnelle d’un livre : il peut être décomposé hiérarchiquement en parties, chapitres, sections, etc. Les textes TEI se conforme généralement à un modèle hiérarchique simple.

On utilise l’attribut xml:id pour indiquer l’identifiant unique de la division. Ce qui est utile pour faire des références croisées ou simplement faire référence à une division donnée, via un commentaire par exemple. Voir aussi ci-dessous 8 Les références croisées et les liens Il est souvent utile d’associer l’attribut xml:id à chaque unité structurelle importante du texte, et d’établir ses valeurs de manière systématique. Par exemple en ajoutant un numéro de section à un code court pour faire référence au titre de l’œuvre. C’est aussi particulièrement utile si la ressource a vocation à être disponible sur le web : les autres applications web pourront facilement pointer directement les parties du texte.

On utilise l’attribut n pour attribuer (de manière additionnelle ou de manière alternative) un nom mnémotechnique ou un nombre à une division, ou bien à n’importe quel autre élément.

On utilise l’attribut xml:lang pour spécifier la langue d’une division. Les langues sont identifiées par un code défini au niveau international. Voir ci-dessous.

On utilise l’attribut rend pour spécifier l’apparence d’une division, ou de n’importe quel autre élément. Voir ci-dessous. Tout comme avec l’attribut type, il est souvent utile de prédéfinir les valeurs possibles de cet attribut. La TEI Lite ne contraint pas l’expression des valeurs de rend.

Ces 4 attributs xml:id, n, xml:lang et rend sont si largement utilisés qu’ils s’appliquent à n’importe quel élément du schéma TEI : ce sont des attributs globaux. D’autres attributs globaux définis dans la TEI Lite sont discutés dans la section 8.3 Les types spéciaux de liens.

La valeur de chaque attribut xml:id doit être unique dans un même document. Une manière simple de s’en assurer est de vérifier qu’elle reflète la structure hiérarchique du document. Par exemple, prenons le roman Les Misérables de Victor Hugo, qui est divisé en cinq tomes, dont chacun contient plusieurs ‘livres’, chaque livre comprenant des chapitres. L’attribut xml:id pourrait avoir la structure suivante :
<div xml:id="LM01n="Itype="tome">
 <div xml:id="LM0101n="1type="livre">
  <div xml:id="LM010101n="I.1"
   type="chapitre">

<!-- premier chapitre -->
  </div>
  <div xml:id="LM010102n="I.2"
   type="chapitre">

<!-- deuxième chapitre -->
  </div>
<!-- ... -->
 </div>
 <div xml:id="LM0102n="Iitype="livre">
  <div xml:id="LM010201n="II.1"
   type="chapitre">

<!-- premier chapitre -->
  </div>
  <div xml:id="LM010202n="II.2"
   type="chapitre">

<!-- deuxième chapitre -->
  </div>
<!-- ... -->
 </div>
</div>
Un système de numérotation différent peut être utilisé pour les attributs xml:id et n, ce qui est souvent utile lorsqu’un schéma de référence ne concorde pas avec la structure de l’œuvre. Par exemple, prenons un roman en plusieurs tomes, chaque tome comprend des chapitres numérotés en fonction de l’ensemble des tomes (et non à l’intérieur de chaque tome). On pourrait utiliser le schéma suivant :
<body>
 <div xml:id="TS01n="Itype="livre">
  <div xml:id="TS011n="1type="chapitre">
<!-- ... -->
  </div>
  <div xml:id="TS012n="2type="chapitre">
<!-- ... -->
  </div>
 </div>
 <div xml:id="TS02n="IItype="livre">
  <div xml:id="TS021n="3type="chapitre">
<!-- ... -->
  </div>
  <div xml:id="TS022n="4type="chapitre">
<!-- ... -->
  </div>
 </div>
</body>

Ici, l’œuvre comprend toujours deux volumes, chaque volume contenant deux chapitres. Les chapitres ont été numérotés de 1 à 4, mais les valeurs de xml:id, qui ont été spécifiées, permettent en outre de les considérer comme s’ils avaient été numérotés 1.1, 1.2, 2.1, 2.2.

4.2 Les têtes et fins de chapitre

Chaque div peut commencer par un titre ou une tête de chapitre, et se terminer (moins couramment) par une formule de fermeture, telle que « Fin du chapitre 1 ». On utilise alors les éléments suivants :

  • head (en-tête) contient tout type d'en-tête, par exemple le titre d'une section, ou l'intitulé d'une liste, d'un glossaire, d'une description de manuscrit, etc.
  • trailer contient un titre de fin ou de bas de page à la fin d’une division du texte.

D’autres éléments qui peuvent être nécessaires au début ou à la fin d’une division sont discutés dans la section 18.1.2 Différents types de liminaires.

Que les têtes de chapitre et fins de chapitre soient inclus ou non dans la transcription relève du choix de l’encodeur. Quand une tête de chapitre est complètement régulière (par exemple « Chapitre 1 ») ou peut être automatiquement générée à partir de la valeur des attributs (par exemple <div type="chapter" n="1">), on peut l’omettre. Mais quand elle contient du texte qu’on ne peut retrouver autrement, on doit toujours ajouter le texte. Par exemple, le début de Notre-Dame de Paris de Victor Hugo pourrait être encodé comme suit:
<div xml:id="NDP01n="Itype="livre">
 <head>Livre premier</head>
 <div n="I.1 type="chapitre">
  <head>La Grand'salle</head>
  <p>Il y a aujourd'hui trois cent quarante-huit ans six mois et dix-neuf jours que
     les parisiens s'éveillèrent au bruit de toutes les cloches sonnant à grande
     volée dans la triple enceinte de la Cité, de l'Université et de la Ville. </p>
<!-- ... -->
 </div>
</div>

4.3 La prose, les vers et le théâtre

Comme dans l’exemple de Brontë ci-dessus, les paragraphes formant une division textuelle sont balisés avec p. Les textes poétiques ou le théâtre demandent d’autres balises, pour représenter par exemple les vers, les strophes dans le premier cas, le discours des individus et les indications scéniques dans le second.

  • l (vers) contient un seul vers, éventuellement incomplet.
  • lg (groupe de vers) contient un groupe de vers fonctionnant comme une unité formelle, par exemple une strophe, un refrain, un paragraphe en vers, etc.
  • sp (langue orale) monologue dans un texte écrit pour la scène ou un passage présenté sous cette forme dans un texte en prose ou en vers.
  • speaker forme particulière de titre ou de marque qui donne le nom d'un ou de plusieurs locuteurs dans un texte ou dans un fragment de texte écrit pour le théâtre.
  • stage (indication scénique) contient tout type d'indication scénique à l'intérieur d'un texte ou fragment de texte écrit pour le théâtre.
Par exemple, voici un poème de Baudelaire où les vers et les strophes ont été balisés :
<text>
 <body>
  <lg type="quatrain">
   <l>Les amoureux fervents et les savants austères</l>
   <l>Aiment également, dans leur mûre saison,</l>
   <l>Les chats puissants et doux, orgueil de la maison,</l>
   <l>Qui comme eux sont frileux et comme eux sédentaires.</l>
  </lg>
  <lg type="quatrain">
   <l>Amis de la science et de la volupté</l>
   <l>Ils cherchent le silence et l'horreur des ténèbres ;</l>
   <l>L'Erèbe les eût pris pour ses coursiers funèbres,</l>
   <l>S'ils pouvaient au servage incliner leur fierté.</l>
  </lg>
  <lg type="tercet">
   <l>Ils prennent en songeant les nobles attitudes</l>
   <l>Des grands sphinx allongés au fond des solitudes,</l>
   <l>Qui semblent s'endormir dans un rêve sans fin ;</l>
  </lg>
  <lg type="tercet">
   <l>Leurs reins féconds sont pleins d'étincelles magiques,</l>
   <l>Et des parcelles d'or, ainsi qu'un sable fin,</l>
   <l>Etoilent vaguement leurs prunelles mystiques.</l>
  </lg>
 </body>
</text>

Notons que l’élément l indique la ligne du vers et non la ligne typographique. La disposition en lignes des premiers vers, ci-dessus, n’a pas été explicitement encodée, et risque donc d'être perdue. On peut utiliser l’élément lb, décrit dans la section 5 Les numéros de pages et les numéros de ligne, si l’on souhaite aussi marquer le début d’une ligne typographique.

Voici la fin d’une pièce de théâtre de Samuel Beckett, dans laquelle les répliques et les indications scéniques sont encodées :
<sp>
 <speaker>Vladimir</speaker>
 <p>Relève ton pantalon.</p>
</sp>
<sp>
 <speaker>Estragon</speaker>
 <p>Que j'enlève mon pantalon ?</p>
</sp>
<sp>
 <speaker>Vladimir</speaker>
 <p>
  <emph>RE</emph>lève ton pantalon.</p>
</sp>
<sp>
 <speaker>Vladimir</speaker>
 <p> C'est vrai. </p>
 <stage>Il relève son pantalon. Silence.</stage>
</sp>
<sp>
 <speaker>Vladimir</speaker>
 <p>Alors, on y va ?</p>
</sp>
<sp>
 <speaker>Estragon</speaker>
 <p>Allons-y.</p>
</sp>
<stage>Ils ne bougent pas.</stage>
Notons que l’élément stage (‘indication scénique’) peut apparaître ou bien dans la réplique ou bien entre deux répliques. L’élément sp (speech ou énoncé) contient, après l’élément optionnel speaker, qui indique qui parle, ou bien des paragraphes (si la réplique est en prose) ou bien des vers ou des strophes (comme dans l’exemple suivant). Dans ce cas, il est assez courant de trouver des vers coupés. La façon la plus simple d’encoder ceci est d’utiliser l’attribut part pour indiquer qu’une ligne (ou un ensemble de lignes) est incomplète de point de vue métrique comme par exemple dans ce passage de Molière :
<sp>
 <speaker>Alceste.</speaker>
 <l>Non : j' ai résolu de n' en pas faire un pas.</l>
 <l part="I">J' ai tort, ou j' ai raison.</l>
</sp>
<sp>
 <speaker>Philinte.</speaker>
 <l part="F">Ne vous y fiez pas.</l>
</sp>
<sp>
 <speaker>Alceste.</speaker>
 <l part="I">Je ne remuerai point.</l>
</sp>
<sp>
 <speaker>Philinte.</speaker>
 <l part="F">Votre partie est forte,</l>
 <l part="I">et peut, par sa cabale, entraîner...</l>
</sp>
<sp>
 <speaker>Alceste.</speaker>
 <l part="F">Il n' importe.</l>
</sp>
<sp>
 <speaker>Philinte.</speaker>
 <l part="I">Vous vous tromperez.</l>
</sp>
<sp>
 <speaker>Alceste.</speaker>
 <l part="F">Soit. J' en veux voir le succès.</l>
</sp>
Le même mécanisme peut être appliqué à des strophes qui sont divisées entre deux locuteurs, par exemple3 :
<div>
 <sp>
  <speaker>PREMIERE VOIX</speaker>
  <lg type="stanzapart="I">
   <l>« Mais qu’est-ce qui fait filer ce bateau</l>
   <l>Sans vague, sans un souffle d’air ? »</l>
  </lg>
 </sp>
 <sp>
  <speaker>SECONDE VOIX</speaker>
  <lg part="F">
   <l>« L’air se fend devant lui à son approche,</l>
   <l>Et puis se referme derrière.</l>
  </lg>
 </sp>
<!-- ... -->
</div>
On peut également utiliser l’élément sp pour le dialogue en prose, comme s’il s’agissait de théâtre. Voir l’exemple4 ci-dessous, qui fait usage de l’attribut who. Cet attribut porte un code permettant d’identifier le locuteur dans le dialogue.
<p> Peu à peu les voix du salon
s’affaiblirent ; la comtesse resta seule avec une de ses amies, mademoiselle Fanny
B***. Toutes deux se trouvèrent bientôt dans la chambre et devant mes yeux.</p>
<sp who="#FAN">
 <speaker>FANNY.</speaker>
 <p>Quel fâcheux contretemps ! La pluie tombe à torrents, et pas une voiture
   !</p>
</sp>
<sp who="#GAM">
 <speaker>GAMIANI.</speaker>
 <p>Je suis désolée comme vous ; par malencontre, ma voiture est chez le
   sellier.</p>
</sp>
<sp who="#FAN">
 <speaker>FANNY.</speaker>
 <p>Ma mère sera inquiète.</p>
</sp>
<sp who="#GAM">
 <speaker>GAMIANI.</speaker>
 <p>Soyez sans crainte, ma chère Fanny, votre mère est prévenue ; elle sait que vous
   passez la nuit chez moi. Je vous donne l’hospitalité.</p>
</sp>
Dans ce cas, les valeurs de l'attribut who (#GAM par exemple) pointent sur une liste des personnages du roman, chacun ayant un identifiant unique correspondant:
<list>
 <head>Caractères du roman</head>
 <item xml:id="FAN">
  <name>Fanny</name> B. : jeune victime fictive </item>
 <item xml:id="GAM">La comtesse <name>Gamiani</name> : héroine du roman, prétendument
   une représentation de l'écrivain Amantine Dudevant ("George Sand")</item>
</list>

5 Les numéros de pages et les numéros de ligne

Les coupures de pages, de lignes, etc. peuvent être balisées par les éléments suivants :

Ces éléments indiquent un endroit précis dans le texte et non un empan. On utilise l’attribut global n pour enregistrer le numéro de la page ou de la ligne commençant à la balise.

Pour l'encodage des sources paginées, comme des imprimés ou des manuscrits, il peut être utile d’enregistrer les sauts de page ou de feuillet au point d'apparition dans le flux du texte, afin notamment de lier le texte aux images de pages (fac-similés), de générer automatiquement une référence bibliographique à la page, etc. Enregistrer les sauts de ligne peut aussi être utile à fin de référence, par exemple pour une édition critique avec des notes qui se réfèrent à des numéros de ligne.

On peut enregistrer plusieurs paginations, par exemple celle d'un manuscrit original et celle d'une édition imprimée de référence, en distinguant les sauts de pages grâce à l'attribut ed. Par exemple, dans le passage suivant, nous indiquons où se trouvent les débuts de page dans deux éditions différentes (ED1 et ED2). Nous indiquons également qu'un fac-similé de la page 240 dans l'édition ED1 est disponible dans le fichier p240.png :
<p>
 <q>Il <pb n="240ed="ED1facs="p240.png"/> y en a de plus jolies, mais elle est
   bonne et n’a pas de défauts. Du reste, il est facile de voir qu’elle lui semble bien
   belle.</q> »
</p>
<p> J’écrivis immédiatement à Moor-House, <pb n="240ed="ED2"/> pour annoncer ce que
j’avais fait. Je donnai toutes les explications nécessaires dans ma...</p>

Les éléments pb et lb appartiennent à la classe générale des éléments milestone, qui permet d’indiquer des points de référence dans un texte. L’élément générique milestone sert à indiquer n’importe quel point de référence : par exemple, le début d'une colonne, le début d’un nouveau type de section, qui ne serait pas balisé autrement, et plus généralement, n’importe quel changement significatif dans le texte qui ne serait pas balisé par un élément XML. Pour ces types d’unités ou bien pour les éditions, on utilise les attributs unit et ed. Leurs valeurs sont librement choisies, mais doivent être documentées dans l’élément refsDecl de l’en-tête. Ces attributs ne doivent pas être mélangés de manière arbitraire : soit on utilise l’élément milestone à la place des autres attributs, soit on utilise ces attributs.

6 Le marquage des expressions mises en valeur

6.1 Les changements de police de caractères, etc.

Les mots ou les expressions mis en valeur sont ceux qui sont visuellement différents du reste du texte ; il s’agit typiquement d’un changement de police, de style d’écriture, de couleur, etc., dont le but est d’attirer l’attention du lecteur. On peut se servir de la balise suivante pour signaler de tels changements:

  • hi (mis en évidence) distingue un mot ou une expression comme graphiquement distincte du texte environnant, sans en donner la raison.

L’attribut global rend peut être associé à n’importe quel autre élément, et utilisé chaque fois que nécessaire pour spécifier la mise en valeur. Par exemple, un titre en gras peut être balisé par <head rend="bold"> et un titre en italiques par <head rend="italic">.

Les valeurs de l’attribut rend ne sont pas spécifiées dans les Recommandations, car elles dépendent entièrement des besoins du projet. Typiquement, ses valeurs sont « italiques », « gras », « exposant », etc. pour le style de la police ; « centré », « aligné à droite » pour l’alignement ; « grand », « petit » pour la taille ; « petitesMajuscules », « majuscules » pour les caractères, etc. Plusieurs de ces valeurs peuvent être combinées si cela est nécessaire, et il n’y pas de syntaxe particulière pour exprimer ces combinaisons. Les Recommandations proposent aussi des mécanismes d’encodage plus rigoureux que celui offert par rend. Ils reposent sur les standards du W3C (comme les CSS).

Ce n’est pas toujours possible ou souhaitable d’interpréter les raisons qui ont présidé à telle ou telle mise en valeur. On peut alors utiliser l’élément hi pour marquer la séquence mise en valeur, sans pour autant faire d’interprétation quant à son statut.

Dans l’exemple suivant, le fait d’utiliser une police de caractères différente pour le nom présent dans le sous-titre et pour le sous-titre lui-même, est enregistré mais non interprété.
<p>
 <hi rend="gothic">Item; il est attesté par le présent acte</hi>, que ledit <hi rend="italic">Walter Shandy</hi>, négociant, en
considération dudit futur mariage
...
</p>

De manière alternative, quand on sait interpréter la mise en valeur, un certain nombre d’autres éléments spécifiques sont disponibles :

  • emph (mis en valeur) marque des mots ou des expressions qui sont accentués ou mis en valeur pour un motif linguistique ou rhétorique.
  • foreign (étranger) reconnaît un mot ou une expression comme appartenant à une langue différente de celle du contexte.
  • gloss (glose) identifie une expression ou un mot utilisé pour fournir une glose ou une définition à quelque autre mot ou expression.
  • label (étiquette) contient l'étiquette attachée à un item dans une liste ; dans les glossaires, il marque le terme qui est défini.
  • term (terme) contient un mot simple, un mot composé ou un symbole, qui est considéré comme un terme technique.
  • title (titre) contient le titre complet d'une oeuvre quelconque

Pour illustrer les éléments que nous avons définis, arrêtons-nous sur la phrase suivante5 : ‘Dans un récent numéro du Bulletin des bibliothèques de France, des collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient pas, loin s’en faut, « disparu de la cité », mais qu’elles se trouvaient au contraire investies d’une « nouvelle pertinence ».’

Si l’on décide d’interpréter la mise en valeur, la phrase pourrait être encodée de la manière suivante :
<p>Dans un récent
numéro du <title>Bulletin des bibliothèques de France</title>, des collègues
affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques n’avaient
pas, loin s’en faut, « <mentioned>disparu de la cité</mentioned> », mais qu’elles se
trouvaient au contraire investies d’une « <mentioned>nouvelle pertinence</mentioned>
»</p>
Si on est intéressé uniquement par la mise en forme de l'original, on pourrait l'encoder ainsi :
Dans un récent numéro du <hi rend="it">Bulletin des bibliothèques de France</hi>, des
collègues affirmaient avec enthousiasme, et non sans bravoure, que les bibliothèques
n’avaient pas, loin s’en faut, « <hi rend="it">disparu de la cité</hi> », mais
qu’elles se trouvaient au contraire investies d’une « <hi rend="it">nouvelle
pertinence</hi> ».

6.2 Les citations et les éléments associés

Tout comme les changements de police de caractères, les guillemets sont utilisés de différentes manières dans les textes, le cas le plus le plus fréquent étant celui de la citation. Quand c’est possible, il importe de ne pas s’en tenir à noter la présence de guillemets, mais plutôt d’étiqueter leur fonction. On utilise alors les éléments suivants :

  • q (séparé du texte environnant par des guillemets) contient un fragment qui est marqué (visiblement) comme étant d’une manière ou d'une autre différent du texte environnant, pour diverses raisons telles que, par exemple, un discours direct ou une pensée, des termes techniques ou du jargon, une mise à distance par rapport à l’auteur, des citations empruntées et des passages qui sont mentionnés mais non employés.
  • mentioned marque des mots ou des expressions employés métalinguistiquement
  • soCalled (so called) contient une expression ou un mot pour lesquels l'auteur ou le narrateur renonce à toute responsabilité, par exemple en utilisant de l'italique ou des guillemets.
  • gloss (glose) identifie une expression ou un mot utilisé pour fournir une glose ou une définition à quelque autre mot ou expression.
Voici un exemple simple d'une citation, extrait des Confessions de Jean-Jacques Rousseau :
<p>Enfin je me rappelai le pis-aller d’une grande princesse à qui l’on disait que les
paysans n’avaient pas de pain, et qui répondit : <q>Qu’ils mangent de la
   brioche.</q>
</p>

Pour indiquer comment la citation a été imprimée (par exemple, sur la même ligne, ou un pavé), on utilise l’attribut rend, qui permet également de spécifier le type de guillemets utilisé.

Le discours direct interrompu par le narrateur peut être simplement représenté en finissant la citation juste avant l’interruption et en la recommençant juste après. Par exemple dans La Quête du Graal (ms K, folio 169, § 55) on lit  :
Et quant Melyan voit ces letres si dist a
Galaad : <q>Frans chevaliers por Dieu lessiez moi entrer en cele a senestre, car en
cele porrai je esprover ma force, et connoistre s’il avra ja en moi proesce ne
hardement por quoi je doie avoir los de chevalerie.</q>
<q>- S’il vos pleust</q>, fait Galaad,
<q>je m’en entrasse en cele a senestre, car si
com je pens je m’en getasse mielz que vos.</q>

S’il est important de signifier que les deux éléments q forment ensemble un seul bloc, on peut utiliser les attributs next et prev. Cf. section 8.3 Les types spéciaux de liens.

On peut associer aux citations des références (par exemple la source, le nom du personnage, etc.), en utilisant l’attribut who, que ces informations soient ou non explicitées dans le texte. Par exemple :
<q who="#Wilson"> Spaulding arriva au
bureau, je me rappelle que ce fut précisément il y a
aujourd’hui huit
jours, avec ce même journal à la main et s’écria : <q who="#Spaulding">— Quel
   malheur, monsieur Wilson ! que je ne sois pas roux.</q>
</q>
Cet exemple6 montre aussi comment les citations peuvent être imbriquées dans d’autres citations : un personnage (Wilson) cite un autre personnage (Spaulding). Le créateur du texte électronique doit décider si les guillemets seront remplacés par des balises, ou si des balises seront ajoutées et les guillemets conservés. Si les guillemets sont supprimés, on peut utiliser l’attribut rend pour décrire les guillemets de la copie papier.

Les Recommandations proposent d’autres éléments permettant de distinguer le discours direct, la citation, et d’autres usages typiques des guillemets, bien qu’il ne soit pas toujours possible ou souhaitable d’interpréter la fonction des guillemets dans un texte. Pour des raisons de simplicité, seul q (qui peut être utilisé dans n’importe quel cas) fait partie de la TEI Lite.

Pour associer une citation bibliographique avec sa source par contre, on peut utiliser l'élément bibl, et emballer les deux dans l'élément cit (voir exemple 11 Les listes).

6.3 Les mots étrangers ou les expressions

Les mots et les expressions qui ne sont pas dans la langue principale du texte peuvent être balisés de deux façons : i) si le mot ou l’expression est déjà balisé pour une raison quelconque par un élément, on associe à ce dernier l’attribut global xml:lang, dont on spécifie la valeur (i.e. de quelle langue il s’agit) ; ii) sinon on utilise l’élément foreign, toujours avec l’attribut xml:lang. Par exemple :
<foreign xml:lang="la">Et vobis</foreign> messieurs,
Ce ne seroyt que bon que nous rendissiez noz cloches...

<p>Avez-vous lu <title xml:lang="de">Die Dreigroschenoper</title>?</p>
<p>On parle des <mentioned xml:lang="en">people</mentioned> dans ce journal</p>
<p>Le <term xml:lang="la">quaternio terminorum</term>, expression venant du latin,
<gloss>l'erreur des quatre termes, </gloss>est un sophisme qui intervient
lorsqu'un syllogisme utilise quatre termes au lieu de trois.</p>

Comme ces exemples le montrent, l’élément foreign ne doit pas être utilisé pour baliser des mots étrangers si un autre élément plus spécifique, tel que title, mentioned, ou term s’applique. L’attribut global xml:lang peut être associé à n’importe quel élément pour exprimer que son contenu n’est pas dans la même langue que celle qui l’entoure.

Les codes utilisés pour identifier les langues, indiquées dans l’attribut xml:lang, doivent se conformer aux standards internet7, tels que cela est expliqué dans les Recommandations. Voici quelques exemples de codes :

zhchinoisgrcgrec ancien
enanglaiselgrec
enmanglais du moyen agejajaponais
frfrancaislalatin
deallemandsasanskrit

7 Les notes

Toutes les notes, qu’elles soient imprimées en bas de page, en fin de chapitre ou d’ouvrage, en marge, ou sous n’importe quelle autre forme doivent être balisées avec le même élément :

Ceci n’est pas toujours possible, notamment avec les notes en marge, qui peuvent ne pas être associées à un appel de note précis. Pour simplifier, on pourra positionner la note en marge avant le paragraphe ou tout autre élément pertinent. Les notes peuvent également être placées dans une partie séparée du texte (comme le sont les notes de fin de chapitre ou d’ouvrage dans les textes imprimés) et liées à la partie adéquate du texte. On utilise alors l’attribut target.

Si besoin, on utilise l’attribut n pour spécifier le numéro ou l’identifiant de la note. L’attribut resp doit être utilisé de manière systématique pour distinguer les notes de l’auteur et les notes de l’éditeur, si l’œuvre comporte ces deux sortes de note.

Un exemple8 :
<p>J'écris dans la<lb/> marge...<lb/> Je vais<lb/> à la ligne.<lb/> Je renvoie à une
note<note type="glossplace="foot"> J'aime beaucoup les renvois en bas de page,
   même si je n'ai rien de particulier à y préciser.</note>en bas de page.</p>
Un autre exemple9 :
<lg>
 <note place="marge"> Le sortilège commence à se rompre.</note>
 <l>Au même instant je pus enfin prier ;</l>
 <l>Et de mon cou se libérant,</l>
 <l>L’Albatros vint à tomber, et coula</l>
 <l>Comme du plomb dans l’océan.</l>
</lg>

8 Les références croisées et les liens

Des références croisées explicites et des liens d’un endroit du texte à un autre, que ce soit dans le même document ou entre deux documents différents, peuvent être encodés en utilisant les éléments décrits dans cette section. Les liens implicites (tels que l’association de deux textes parallèles, ou bien l’association d’un texte et de son interprétation) peuvent être encodés en utilisant les attributs présentés dans la section 8.3 Les types spéciaux de liens.

8.1 Les références croisées simples

Si l’on veut relier deux endroits d’un même texte, on utilise l’un des éléments suivants :

  • ref (référence) définit une référence vers un autre emplacement, la référence étant éventuellement modifiée ou complétée par un texte ou un commentaire.
  • ptr (pointeur) définit un pointeur vers un autre emplacement.

L’élément vide ptr marque l’endroit à partir duquel on crée le lien, tandis que ref contient du texte. Le plus souvent il s’agira du texte de la référence croisée elle-même. L’élément ptr doit être utilisé pour une référence croisée signalée par des moyens non verbaux, tels qu’un symbole ou une icône, ou encore un bouton dans un texte électronique. Il est également utile dans les systèmes de production de document, si le système de formatage est capable de générer correctement l’expression de la référence croisée.

Les deux formes suivantes sont logiquement équivalentes :
Cf. tout particulièrement <ref target="#SEC12">la section 12, page 34</ref>.
Cf. tout particulièrement <ptr target="#SEC12"/>.
La valeur de l’attribut target de l’un ou l’autre de ces éléments peut être l’identifiant d’un autre élément du texte courant. Le passage ou l’expression que l’on cible doivent porter un identifiant, et donc être balisés comme un élément d’un certain type. Dans l’exemple suivant, la référence croisée pointe sur un élément div :
... Cf. tout
particulièrement <ptr target="#SEC12"/>. ...
<div xml:id="SEC12">
 <head>Au sujet des identifiants</head>
<!-- ... -->
</div>
Comme xml:id est un attribut global, on peut pointer de cette manière sur n’importe quel élément d’un texte TEI. Dans l’exemple suivant, on a associé un identifiant à un paragraphe pour qu’on puisse pointer sur lui.
... voir discussion de ce point au <ref target="#pspec">paragraphe qui traite des liens</ref> ...
<p xml:id="pspec">Les
liens peuvent s'effectuer vers tout type d'élément ...</p>

Parfois, la cible d’une référence croisée ne correspond à aucune caractéristique particulière du texte, et de ce fait peut ne pas être balisée comme un élément d’un certain type. Si la cible que l’on souhaite indiquer correspond simplement à un endroit du document courant, la manière la plus simple de procéder est d’utiliser l’élément anchor, à l’endroit ciblé. Si la cible est une certaine suite de mots, qui n’est pas déjà balisée, l’élément seg peut être utilisé. Ces deux éléments se laissent décrire de la manière suivante :

  • anchor (point d'ancrage) attache un identifiant à un point du texte, que ce point corresponde ou non à un élément textuel.
  • seg (segment quelconque) contient une unité de texte quelconque de niveau ‘segment’.
Dans l’exemple (inventé) suivant, les éléments ref sont utilisés pour représenter les endroits du texte qui doivent être associés à d’autres parties du texte ; dans le premier cas, à un endroit particulier, et dans le second à une suite de mots :
Retournant à <ref target="#ABCD">la phrase où je me suis endormi</ref>, j'ai noté que <ref target="#EFGH">trois
mots</ref> avaient été soulignés par un lecteur précédent

Cet encodage demande que les éléments ayant des identifiants spécifiques (ABCD et EFGH dans cet exemple) soient effectivement quelque part dans le texte. Si aucun élément ne porte déjà ces identifiants, on peut utiliser les éléments anchor et seg.

.... <anchor type="bookmarkxml:id="ABCD"/> .... ....<seg type="targetxml:id="EFGH"> ... </seg> ...

On doit utiliser l’attribut type (comme ci-dessus) pour distinguer les différents rôles que pourraient jouer ces éléments généraux. D’autres utilisations sont présentées ci-après.

8.2 Le renvoi à d’autres documents

Jusqu’à maintenant, nous avons montré comment on pouvait utiliser les éléments ptr et ref pour établir des références croisées ou des liens, dont les cibles se situent dans le même texte. Cependant, on peut aussi utiliser ces deux éléments pour renvoyer à des éléments de n’importe quel autre document ou ressource XML, tel qu’un document sur le web, une partie d’une base de données. Ceci est possible si l’attribut target porte comme valeur n’importe quelle URI10 valide.

Un URI peut renvoyer à une page web, ou seulement à une partie de cette page. Par exemple : dans http://www.tei-c.org/index.xml#SEC2", le signe # indique que ce qui suit est l’identifiant d’un élément situé dans le document XML, dont l’adresse est indiquée par ce qui précède : cet exemple vise par conséquent un élément qui a un attribut xml:id dont la valeur est SEC2, dans le document extrait de http://www.tei-c.org/index.xml. Dans les exemples que nous avons présentés jusqu’à maintenant, la partie à gauche du signe # a toujours été omise, ce qui signifiait justement que l’élément auquel on renvoyait se trouvait dans le même document.

Des parties d’un document XML peuvent être spécifiées par d’autres moyens plus sophistiqués, qui utilisent XPath. Ce langage est aussi défini par le W3C. Il est particulièrement utile quand les éléments à associer ne portent pas d’identifiants et doivent alors être localisés par d’autres moyens.

8.3 Les types spéciaux de liens

Les attributs suivants, qui ont des rôles spécifiques, sont définis pour tous les éléments du schéma TEI Lite :

ana
lie un élément à son interprétation
corresp
lie un élément avec un ou plusieurs autres éléments correspondants
next
lie un élément avec l’élément suivant de l’ensemble
prev
lie un élément avec l’élément précédent de l’ensemble
On utilise l’attribut ana (analysis - analyse) lorsque des ensembles rassemblant des analyses abstraites ou des interprétations ont été définis quelque part dans le document. Cf. 15 L’interprétation et l’analyse. Par exemple, une analyse linguistique de « Jean aime Nancy » pourrait être encodée comme suit :
<seg type="sentenceana="SVO">
 <w ana="#NP1">Jean</w>
 <w ana="#VVI">aime</w>
 <w ana="#NP1">Nancy</w>
</seg>

Cet encodage implique l’existence quelque part dans le document d’éléments avec les identifiants SVO, NP1 et VVI, où la signification de ces codes particuliers est explicitée. Notons ici l’utilisation de l’élément seg pour marquer les composants particuliers d’une analyse, qui sont distingués par l’attribut type.

On utilise l’attribut corresp (correspondant) pour indiquer d'une manière simple tout type de correspondance entre deux éléments. Par exemple, dans un texte multilingue, il peut servir à lier ensemble les phrases équivalentes :
<seg xml:lang="frxml:id="FR1"
 corresp="#EN1">
Jean aime Nancy</seg>
<seg xml:lang="enxml:id="EN1"
 corresp="#FR1">
John loves Nancy</seg>
On peut utiliser ce même mécanisme dans divers cadres. Dans l’exemple11 qui suit, on l’utilise pour représenter la relation anaphorique entre « le village » et « Châteauvillain », et entre « la fête foraine » et « la fête de la Trinité »
<p>
 <name type="placexml:id="CVN">Châteauvillain</name> renouvelle avec une vieille
tradition de la localité qui avait été un peu oubliée depuis quelques années : <seg xml:id="feteTrin">la fête de la Trinité</seg>. Autrefois, il s'agissait des
grandes réjouissances annuelles de la commune. Pour ce retour attendu, <rs corresp="#feteTrin">la fête foraine</rs> s'installera dans <rs corresp="#CVN">le
   village</rs> les 29 et 30 mai.
</p>
Les attributs prev et next permettent de relier de manière simple des constituants discontinus, comme dans l’exemple suivant :
<p> «<q xml:id="Q1anext="#Q1b">Marie</q>,
dis-je, <q xml:id="Q1bprev="#Q1a">j’ai été mariée ce matin à M. Rochester.</q> »
</p>.

9 Les interventions éditoriales

L’encodage d’un texte électronique a beaucoup à voir avec l’édition d’un manuscrit ou celle d’un texte destiné à être publié. Dans les deux cas, un éditeur consciencieux peut vouloir conserver l’état original de la source et la trace des corrections ou des changements qu’il a opérés. Pour ce faire, on utilisera les éléments décrits dans cette section et dans la section suivante,

9.1 La correction et la normalisation

On utilise les éléments suivants pour indiquer une correction, soit des changements éditoriaux introduits par l’éditeur, qui pense que l’original présente des erreurs :

  • corr (correction) contient la forme correcte d'un passage qui est considéré erroné dans la copie du texte.
  • sic (du latin, ainsi) contient du texte reproduit quoiqu'il est apparemment incorrect ou inexact

On utilise les éléments suivants pour indiquer une standardisation, soit des changements éditoriaux introduits pour des raisons de cohérence ou de modernisation d’un texte :

  • orig (forme originale) contient une partie notée comme étant fidèle à l'original et non pas normalisée ou corrigée.
  • reg (régularisation) contient une partie qui a été régularisée ou normalisée de façon quelconque
Par exemple, considérons cette fable de La Fontaine, qui, dans sa première version imprimée, commence ainsi:
Maistre Corbeau sur un arbre perché
Tenoit en son bec un fromage.
Maistre Renard par l'odeur alléché
Luy tint à peu près ce langage:
Et bonjour, Monsieur du Corbeau :
Que vous estes joly! que vous me semblez beau:
Un éditeur moderne pourrait vouloir apporter un nombre de modifications, notamment pour moderniser (ou normaliser) l’orthographe. L’encodage serait alors le suivant :
<l>
 <reg>Maître</reg> Corbeau sur un arbre
perché,
</l>
<l>
 <reg>Tenait</reg> en son bec un fromage.
</l>
<l>
 <reg>Maître</reg>
Renard par l'odeur alléché
</l>
<l>
 <reg>Lui</reg> tint à peu près ce langage:
</l>
<l>Et
bonjour, Monsieur du Corbeau</l>
<l>Que vous <reg>êtes</reg>
 <reg>joli</reg>! que vous me semblez beau!</l>
Un éditeur plus conservateur, ou très soucieux des sources, voudrait sans doute s’en tenir à l’original, mais, dans le même temps, signaler que certaines lectures peuvent être anomales.
<l>
 <orig>Maistre</orig>
Corbeau sur un arbre perché,
</l>
<l>
 <orig>Tenoit</orig> en son bec un fromage.
</l>...
Finalement, un éditeur numérique moderne peut décider de combiner ces deux possibilités dans un seul texte composite, en utilisant l’élément choice.
  • choice (choix) regroupe un certain nombre de balisages alternatifs possibles pour un même endroit dans un texte.
Celui-ci permet à l’éditeur d’indiquer que des lectures alternatives sont possibles
<l>
 <choice>
  <orig>Maistre</orig>
  <reg>Maître</reg>
 </choice>Corbeau sur un arbre
perché,
</l>
<l>
 <choice>
  <orig>Tenoit</orig>
  <reg>Tenait</reg>
 </choice> en son bec un
fromage.
</l>
<l>
 <choice>
  <orig>Maistre</orig>
  <reg>Maître</reg>
 </choice> Renard par
l'odeur alléché
</l>
<l>
 <choice>
  <orig>Luy</orig>
  <reg>Lui</reg>
 </choice> tint à peu
près ce langage:
</l>
<l>Et bonjour, Monsieur du Corbeau :</l>
<l>Que vous
<choice>
  <orig>estes</orig>
  <reg>êtes</reg>
 </choice>
 <choice>
  <orig>joly</orig>
  <reg>joli</reg>
 </choice> ! que vous me semblez
beau!</l>

9.2 Les omissions, les suppressions et les ajouts

Outre la correction et la standardisation des mots et des expressions, les éditeurs ou les transcripteurs peuvent également indiquer du matériel manquant, omettre du matériel ou transcrire du matériel qui a été supprimé ou rayé. Des matériaux peuvent également se révéler particulièrement difficiles à transcrire, par exemple quand ils sont difficilement déchiffrables. Pour ces différents cas, on utilise les éléments suivants :

  • add ( ajout) contient des lettres, des mots ou des phrases insérés dans le texte par un auteur, un copiste, un annotateur ou un correcteur.
  • gap (omission) indique une omission dans une transcription, soit pour des raisons éditoriales décrites dans l'en-tête TEI au cours d’un échantillonnage, soit parce que le matériau est illisible ou inaudible.
  • del (suppression) contient une lettre, un mot ou un passage supprimé, marqué comme supprimé, sinon indiqué comme superflu ou erroné dans le texte par un auteur, un copiste, un annotateur ou un correcteur.
  • unclear (incertain) contient un mot, une expression ou bien un passage qui ne peut être transcrit avec certitude parce qu'il est illisible ou inaudible dans la source.

On utilise ces éléments pour marquer les changements opérés par l’éditeur, le transcripteur, l’auteur ou le copiste (pour ces deux derniers, dans le manuscrit même). Par exemple, soit la source suivante :

Ces éléments servent à indiquer les changements opérés par par un éditeur
On voudrait corriger l’erreur manifeste, mais dans le même temps, conserver la trace de la suppression du deuxième « par » :
Ces
éléments servent à indiquer les changements opérés par <del resp="#LDB">par</del> un
éditeur.
La valeur #LDB de l’attribut resp est alors utilisée pour pointer sur l’identification de ceux qui sont responsables de la correction (typiquement dans un élément respStmt).
Soit la source suivante :
Ces éléments servent à indiquer changements opérés par un éditeur.
L'article a été supprimé par inadvertance. Le texte corrigé pourrait alors être encodé de la manière suivante :
Ces éléments servent à indiquer <add resp="#LB">les</add> changements opérés par un éditeur.
Ces éléments ne se limitent pas à indiquer les changements opérés par un éditeur. Ils peuvent être aussi utilisés pour conserver des changements opérés par l’auteur. Un manuscrit dans lequel un auteur a d’abord écrit « How it galls me, what a galling shadow », puis remplacé le mot « galls » par « dogs », pourrait être encodé comme suit :
How it <del hand="#DHLtype="overstrike">galls</del>
<add hand="#DHLplace="supralinear">dogs</add> me, what a galling shadow
A nouveau, le code #DHL pointe sur un autre endroit du texte, où l’on dispose de plus d’informations. De manière similaire, on utilise les éléments unclear et gap pour indiquer l’omission d’un matériel illisible ; l’exemple suivant montre également l’utilisation de add pour un ajout fait d'une autre main :
<add hand="#EPRplace="inspace">Envoyez-moi une épreuve <unclear cert="medium">W</unclear>
 <gap reason="inDéchiffrable"/>
</add>
L’élément del indique que le matériel transcrit est, sur l’original, marqué comme supprimé, tandis que l’élément gap indique l’endroit où se trouve le matériel omis, que cette décision soit considérée comme opportune ou pas. Un corpus linguistique, par exemple, pourrait omettre les longues citations en langue étrangère, ou bien omettre systématiquement les figures, et les formules mathématiques. Voici un exemple12 :
<p>Dans de tels
puzzles les pièces se divisent en quelques grandes classes dont les plus connues
sont : les bonshommes <gap>
  <desc xml:lang="en"
   versionDate="2014-01-12">
figure représentant plusieurs pièces de puzzle de
     ce type</desc>
 </gap>; les croix de Lorraine <gap>
  <desc xml:lang="en"
   versionDate="2014-01-12">
figure représentant
     plusieurs pièces de puzzle de ce type</desc>
 </gap>; et les croix
<gap>
  <desc xml:lang="en"
   versionDate="2014-01-12">
figure représentant plusieurs pièces de puzzle de ce
     type</desc>
 </gap>
</p>

9.3 Les abréviations et leurs formes développées

Tout comme les noms, les dates et les nombres, les abréviations peuvent être transcrites telles qu’elles sont écrites ou bien développées. Elles peuvent rester non marquées, ou bien encodées en utilisant les éléments suivants :

  • abbr (abréviation) contient une abréviation quelconque.
  • expan (expansion) contient l'expansion d'une abréviation.
L’élément abbr est utile pour distinguer des items semi-lexicaux tels que des acronymes, ou du jargon. Voici un exemple13  :
<head>Lutte contre le nepotisme : le
<abbr>PS</abbr> entrave
<abbr>EE-LV</abbr>
</head>
On utilise l’attribut type pour distinguer les types d’abréviation en fonction de leur rôle. On utilise l’élément expan pour indiquer que la forme développée de l’expression a été fournie par l’encodeur. Cet élément est particulièrement utile dans la transcription de manuscrits. Par exemple, dans les manuscrits de l’époque médiévale, on trouve très couramment le caractère p avec une hampe barrée, qui est la représentation conventionnelle du mot « per ». Un encodeur peut choisit de le développer de la manière suivante :
<expan>per</expan>
La forme développée de l’abréviation ne contient pas toujours les mêmes lettres que celles qui ont été utilisées dans l’abréviation. Quand cela arrive, cependant, la pratique éditoriale courante est d’utiliser les italiques, ou sinon de signaler quelles lettres ont été ajoutées. L’élément expan ne doit pas être utilisé dans ce cas, car sa fonction est d’indiquer la forme développée et non une partie de celle-ci. Par exemple, considérons l’abréviation c (pour cum), que l’on trouve souvent dans les textes médiévaux. Dans une édition moderne, un éditeur pourrait vouloir représenter ceci par ‘cum’, en mettant en italiques les lettres ajoutées. Un moyen simple d’y arriver serait de l’encoder comme suit :
<expan>c<hi rend="it">um</hi>
</expan>
Pour enregistrer à la fois une abréviation et sa forme développée, on peut utiliser l’élément choice, mentionné plus haut, pour rassembler la forme abrégée et la forme développée :
<choice>
 <abbr>c</abbr>
 <expan>cum</expan>
</choice>

10 Les noms, les dates, et les nombres

Le schéma TEI permet de distinguer et d'identifier toutes sortes d'entités nommées, comme les noms de personnes et les noms de lieux, de marques, d'organisations, mais aussi des nombres ou des dates, autant d'informations précises qui produisent ou accrochent le texte à un contexte. Ces infomations factuelles rendent le text utile à de nombreuses disciplines, par exemple l'histoire ou la sociologie. Elles interessent aussi les applications linguistiques, en permettant par exemple d'isoler tous les mots qui ne figurent pas dans un dictionnaire de langue. Les éléments décrits ici, en rendant ces caractéristiques explicites, réduisent la complexité des traitements automatiques des textes.

10.1 Les dénominations et les expressions référentielles

Une expression référentielle est une expression qui réfère à une personne, un lieu, un objet. Deux éléments permettent de caractériser une telle expression :

  • rs (chaîne de référence) contient un nom générique ou une chaîne permettant de s'y référer.
  • name (nom, nom propre) contient un nom propre ou un syntagme nominal.
On utilise l’attribut type pour distinguer les noms de personnes, de lieux, d’organisations, quand cela est possible. Voici un exemple14 :
Le premier dîner que <rs type="person">M. de
Norpois</rs> fit à la maison, une année où je jouais encore aux <rs type="place">Champs-Élysées</rs>, est resté dans ma mémoire, parce que l’après-midi de ce même
jour fut celui où j’allai enfin entendre <rs type="person">la Berma</rs>, en « matinée
», dans
<title>Phèdre</title>
Dans ce deuxieme exemple15, on traite le nom d'un ministère, pareillement aux autres agences, comme "organization" :
Comme le <rs type="organization">ministère
des Circonlocutions</rs> avait pour principe de ne jamais donner une réponse
catégorique, sous quelque prétexte que ce fût, <rs type="person">M. Mollusque</rs> se
contenta de répondre :
<q>C’est possible.</q>
Comme l’exemple suivant le montre, l’élément rs peut être utilisé pour faire référence à une personne, un lieu, etc., qui n’est pas nécessairement exprimé sous la forme d’un nom propre ou d’un groupe nominal.
<rs type="person">M. de Norpois</rs> avait
changé, sur un point bien plus important pour moi, les intentions de <rs type="person">mon père</rs>. ...

L’élément name par contraste est utilisé avec des noms propres. Il est alors synonyme de l’élément rs, ou enchâssé dans cet élément si l’expression référentielle comporte un mixte de noms propres et de noms communs (par exemple « Dédé l’embrouille »).

Etiqueter simplement une expression comme une dénomination permet rarement de traiter automatiquement les noms de personnes dans les formes habituellement attendues par les cadres d’analyse qui s’intéressent aux expressions référentielles. Le nom tel qu’il apparaît dans le texte peut être orthographié de manière erronée, partielle ou vague. En outre, il peut y avoir des particules telles que « van », « de la », etc., qui peuvent ou non être traitées comme faisant partie du nom, et qui dépendent de la langue et du pays d’origine du porteur.

L’attribut key propose un identifiant alternatif standard pour les objets nommés, analogue à une clé dans une base de données. C’est alors un moyen pratique pour rassembler toutes les références dispersées dans le texte, qui renvoient au même individu, au même lieu :
Le premier
dîner que <rs type="personkey="NORP1">M. de Norpois</rs> fit à la maison, une année
où je jouais encore aux <rs type="placekey="CE">Champs-Élysées</rs>, est resté dans
ma mémoire, parce que l’après-midi de ce même jour fut celui où j’allai enfin entendre
<rs type="personkey="LABM">la Berma</rs>, en « matinée », dans

<title>Phèdre</title>
Cette utilisation doit être distinguée de celle qui fait usage de l’élément reg (regularization - régularisation), qui permet de marquer la forme normalisée d’une expression référentielle :
<name type="personkey="DANT1">
 <choice>
  <reg>Georges Jacques Danton</reg>
  <sic>Danton</sic>
 </choice>
</name> est
né le 26 octobre 1759 à <name key="AsA"> Arcis-sur-Aube</name> et mort le 5 avril 1794
(16 germinal an II) à Paris.
L’élément index, discuté dans la section indexation, peut être plus approprié si le rôle de la régularisation est de fournir un index cohérent :
<p>Emmanuel Le Roy Ladurie
s'appuie sur les registres d'inquisition de <name type="person">Jacques
   Fournier</name>
 <index>
  <term>Benoit XII, Pape d'Avignon (Jacques
     Fournier)</term>
 </index> afin de retracer la vie des habitants de Montaillou en
Haute-Ariège « infesté » par le catharisme. </p>

Bien qu’elles soient pertinentes pour des applications simples, ces méthodes présentent deux inconvénients : il faut répéter la régularisation pour chaque occurrence du même nom ; et le poids de l’encodage supplémentaire XML dans le corps du texte peut devenir difficile à maintenir et compliqué à traiter. En onomastique ou en histoire par exemple, on est concerné par les personnes ou les lieux nommés, plutôt que par les noms eux-mêmes. En ce cas ou bien si l’on souhaite faire une analyse détaillée des constituants du nom, on se reportera aux Recommandations, qui fournissent un large éventail de solutions.

10.2 Les dates et les heures

Voici des balises permettant d’encoder les heures et les dates de manière plus précise :

  • date (date) contient une date exprimée dans n'importe quel format.
  • time (temps) contient une expression qui précise un moment de la journée sous n'importe quelle forme.
Ces éléments ont un nombre d’attributs, dont les valeurs sont exprimées selon des formats standardisés.
  • att.datable fournit des attributs pour la normalisation d'éléments qui contiennent des mentions d'événements datés ou susceptibles de l'être
    periodfournit un pointeur vers un emplacement donné définissant une période de temps nommée durant laquelle l'item concerné s'inscrit.
    when [att.datable.w3c]spécifie une date exacte pour un événement sous une forme normalisée, par ex. aaaa-mm-jj.
L’attribut when sert à spécifier la forme de la date ou de l’heure ; il repose sur l’un des formats normalisés ISO 8601. Des dates partielles ou des heures (par exemple, « 1990 », « septembre 1990 », « douzaine ») peuvent être représentées en omettant une partie de la valeur fournie :
<date when="1980-02-21">21 fevrier
1980</date>
<date when="1990">1990</date>
<date when="1990-09">septembre
mcmxc</date>
<date when="--09">septembre</date>
<date when="2001-09-11T12:48:00">11
septembre, neuf heures moins douze GMT</date>
Notons, dans le dernier exemple, l’utilisation d’une représentation normalisée pour une date, qui inclut une heure : cet exemple aurait pu aussi être encodé en utilisant l’élément time.
Décret de la
Convention <date when="1794-10-30">9 Brumaire An III</date>
<l>specially when it's nine below zero</l>
<l>and <time when="15:00:00">three o'clock in the afternoon</time>
</l>

10.3 Les nombres

Les nombres peuvent être écrits en lettres ou en chiffres (vingt et un, xxi et 21), et leur représentation dépend de la langue (par exemple, en anglais 5th est équivalent à 5 en grec ; 123,456.78 en anglais est équivalent à 123.456,78 ou 123 456,78 en français). Dans des applications TAL, il est souvent utile de les distinguer des parties plus proprement « lexicales » du texte. Dans d’autres applications, la possibilité d’enregistrer la valeur d’un nombre dans un format normalisé est importante. L’élément num le permet :

  • num (numéral) contient un nombre écrit sous une forme quelconque.
Par exemple:
<num value="33">xxxiii</num>
<num type="cardinalvalue="21">vingt et un</num>
<num type="percentagevalue="10">dix pourcent</num>
<num type="percentagevalue="10">10%</num>
<num type="ordinalvalue="5">5eme</num>

11 Les listes

L’élément list sert à baliser n’importe quelle sorte de liste. Une liste est un glossaire ou bien une séquence d’items textuels, qui peuvent être numérotées ou non. Chaque item peut être précédé par une étiquette (dans un glossaire, cette étiquette est le terme qui est défini).

Les items d’une liste sont balisés par l’élément item. Le premier item peut être précédé de head, qui indique qu’il est le premier élément de la liste. La numérotation de la liste peut être omise, ou bien spécifiée grâce à l’attribut n, que l’on associe à chaque item, ou bien encore (plus rarement) en utilisant l’élément label. Les encodages suivants sont donc tous équivalents :
<list>
 <head>Une liste courte</head>
 <item>Premier item de la liste.</item>
 <item>Deuxième item de la liste.</item>
 <item>Troisième item de la liste.</item>
</list>
<list>
 <head>Une liste courte</head>
 <item n="1">Premier item de la liste.</item>
 <item n="2">Deuxième item de la liste.</item>
 <item n="3">Troisième item de la liste.</item>
</list>
<list>
 <head>Une liste courte</head>
 <label>1</label>
 <item>Premier item de la liste.</item>
 <label>2</label>
 <item>Deuxième item de la liste.</item>
 <label>3</label>
 <item>Troisième item de la liste.</item>
</list>

On ne doit pas mélanger les styles dans une même liste.

Un simple tableau à deux colonnes peut traiter la liste de type glossaire. Elle sera balisée avec l’élément <list type="gloss">. Chaque item, ici, comprend un terme et une glose, qui sont balisés respectivement par label et item. Ils correspondent aux éléments term et gloss, qui peuvent apparaître dans n’importe quel texte en prose. Voici un exemple du Petit glossaire pour servir à l'intelligence des auteurs décadents et symbolistes (1888) de Jacques Plowert :
<list type="gloss">
 <label>ENGOULER</label>
 <item>
  <p>v. a. — Avaler d’une manière goulue.</p>
  <cit>
   <q>le vitrail jaune des portes de brasseries, tantôt vomissant, tantôt
       engoulant des masses noires.</q>
   <bibl>Les Demoiselles Goubert.</bibl>
  </cit>
 </item>
 <label>ENGRANDEUILLER(s’)</label>
 <item>
  <p>v. p. - Se mettre en grand deuil. </p>
  <cit>
   <q>L'automne s’engrandeuille au bois de Boulogne.</q>
   <bibl>
    <title>Complaintes.</title> Jules Laforgue. </bibl>
  </cit>
 </item>
 <label>ENJAUNI.</label>
 <item>
  <p>Adj. — Rendu jaune.</p>
  <cit>
   <q>La bâtisse de l'Opéra aux baies enjaunies de lumière où des ombres se
       heurtent. </q>
   <bibl>
    <title>Thé chez Miranda.</title> Paul Adam. </bibl>
  </cit>
 </item>
 <label>ENVOL</label>
 <item>
  <p>s. M. — Vol elliptique.</p>
  <cit>
   <q>Un envol de pigeons écarlates tonne autour de ma pensée. </q>
   <bibl>
    <title>Illuminations.</title> A. Rimbaud.</bibl>
  </cit>
 </item>
</list>

Notons ici que le contenu des éléments item peut être assez riche : dans le cas précèdant, on s'est servi de l'élément cit pour fournir l'exemple cité pour chaque définition. Si la structure interne d’un item dans une liste est très complexe, il pourrait être préférable de considérer la liste comme un tableau, pour laquelle un encodage spécifique peut être défini. Voir ci-dessous 13 Les tableaux.

Des listes de toutes sortes peuvent, bien sûr, être enchâssées dans d’autres listes à n’importe quel niveau de profondeur. Ici, par exemple, une liste des vins16 est organisée à plusieurs niveaux:
<list>
 <item>vins d'Alsace <list>
   <item>Riesling</item>
   <item>Traminer</item>
   <item>Pinot noir</item>
   <item>Tokay</item>
  </list>
 </item>
 <item>Bordeaux rouge <list>
   <item>Médoc : <list>
     <item>Château-de-1'Abbaye-Skinner</item>
     <item> Château-Lynch-Bages</item>
     <item>Château-Palmer</item>
     <item>Château-Brane-Cantenac</item>
     <item> Château-Gruau-Larose</item>
    </list>
   </item>
  </list>
 </item>
 <item> Graves : <list>
   <item>Château-La-Garde-Martillac</item>
   <item>Château-Larrivet-Haut-Brion; </item>
  </list>
 </item>
 <item> Saint-Emilion : <list>
   <item>Château-La-Tour-Beau-Site</item>
   <item>Château-Canon</item>
   <item> Château-La-Gaffeière</item>
   <item>Château-Trottevieille </item>
  </list>
 </item>
 <item>Pomerol : <list>
   <item>Château-Taillefer</item>
  </list>
 </item>
 <item>Bordeaux blanc <list>
   <item>: Sauternes : <list>
     <item>Château-Sigalas-Rabaud</item>
     <item>Château-Caillou</item>
     <item>Château-Nairac </item>
    </list>
   </item>
  </list>
 </item>
</list>
Une liste peut ne pas être présentée sous forme de liste. Par exemple 17 :
<p>Dans les pages lointaines de ce livre, il
est écrit que les animaux se divisent en <list rend="run-on">
  <item n="a">appartenant à l'Empereur,</item>
  <item n="b">embaumés, </item>
  <item n="c">apprivoisés, </item>
  <item n="d">cochons de lait, </item>
  <item n="e">sirènes, </item>
  <item n="f">fabuleux, </item>
  <item n="g">chiens en liberté, </item>
  <item n="h">inclus dans la présente classification, </item>
  <item n="i">qui s'agit comme des fous, </item>
  <item n="j">innombrables, </item>
  <item n="k">dessinés avec un très fin pinceau, </item>
  <item n="l">et caetera, </item>
  <item n="m">qui viennent de casser la cruche, </item>
  <item n="n">qui de loin semblent des mouches.</item>
 </list>
</p>

Les listes de références bibliographiques doivent être balisées par l’élément listBibl, qui est décrit dans la section suivante.

12 Les références bibliographiques

Il est souvent utile de distinguer les références bibliographiques qui apparaissent dans les textes transcrits à des fins de recherche, ne serait-ce que pour qu’elles soient proprement formatées au moment de l’impression. L’élément bibl sert à cela. Lorsque les composants d’une référence bibliographique doivent être distingués, on utilise les éléments présentés ci-dessous. Souvent, il est utile de marquer certaines parties, telles que le titre des articles, des livres et des revues, car elles requièrent un formatage spécifique. Les autres éléments proposés s’adressent avant tout aux projets qui portent un intérêt tout particulier au matériel bibliographique.

Par exemple, la note éditoriale à la fin de cette phrase18 ‘En février 1989, il ouvre la session publique organisée par le Parlement européen au sujet des violations des droits de l'Homme commises par le régime communiste roumain (François Fetjö, Ewa Kulesza-Mietkowski, La Fin des démocraties populaires, Seuil, 1992, page 319). pourrait être transcrite de la manière suivante : ... violations des droits de l'Homme
commises par le régime communiste roumain (<bibl>
 <author>François Fetjö</author>,
<author>Ewa Kulesza-Mietkowski</author>, <title>La Fin des démocraties
   populaires</title>, <publisher>Seuil</publisher>, <date>1992</date>,
<biblScope>page 319</biblScope>
</bibl>).

La référence bibliographique peutt également être séparée du texte, par exemple quand elle figure dans une note en bas de page, ou dans une liste de références balisée avec l’élément listBibl ; dans ce cas, le renvoi à la référence dans le texte sera balisée avec un ref ou un ptr.

13 Les tableaux

Les tableaux constituent un défi à tous les systèmes de traitement automatique, mais les tableaux simples sont du moins si fréquents dans les textes que, même dans l’ensemble simplifié qui est présenté ici, le balisage des tableaux est nécessaire. Les éléments suivants apportent des solutions :

Prenons ce tableau indiquant les pentes moyennes de plusieurs aqueducs antiques, retrouvé dans Les aqueducs antiques de Germain de Montauzan (1908). Notons l'usage de l'attribut role pour indiquer que toute cellule du premier rang contient un label, et non pas une donnée.

<p>Voici quelques exemples de pentes moyennes observées sur des aqueducs antiques, en
France, autres que ceux de Lyon : <table>
  <row role="label">
   <cell>Aqueduc</cell>
   <cell>pente par kil.</cell>
   <cell>pente par m.</cell>
  </row>
  <row>
   <cell>de Vienne </cell>
   <cell>1m,16 </cell>
   <cell>0,0016 </cell>
  </row>
  <row>
   <cell>d’Arcueil</cell>
   <cell>1m,00 </cell>
   <cell>0,0010 </cell>
  </row>
  <row>
   <cell>d’Evreux</cell>
   <cell>0m,834</cell>
   <cell>0,0008 </cell>
  </row>
  <row>
   <cell>de Rodez</cell>
   <cell>0m,50</cell>
   <cell>0,0005 </cell>
  </row>
  <row>
   <cell>d’Antibes</cell>
   <cell>0m,41</cell>
   <cell> 0,0004 </cell>
  </row>
  <row>
   <cell>de Nîmes</cell>
   <cell>0m,342 </cell>
   <cell>0,0003 </cell>
  </row>
  <row>
   <cell>(minimum)</cell>
   <cell>0m,071</cell>
   <cell>0,00007 </cell>
  </row>
 </table>
</p>

14 Les figures et les graphiques

Tous les composants d’un document ne sont pas forcément de nature textuelle. Le texte même le plus simple contient souvent des diagrammes et des illustrations, sans parler des textes où image et texte sont inextricablement imbriqués, ou des ressources électroniques dans lesquelles les deux sont complémentaires.

L’encodeur peut simplement noter la présence d’un graphique, et éventuellement décrire brièvement son contenu. Il peut également associer un lien vers la version numérique du graphique, en utilisant les éléments suivants :

Toute information textuelle accompagnant le graphique, telle que le titre ou la légende, peut être incluse dans l’élément figure lui-même, qui comporte un élément head et un ou plusieurs éléments p. On peut inclure également le texte qui est dans le graphique. Il est fortement recommandé que l’élément figDesc comporte une description de l’image, pour que cela soit utilisable par des applications qui ne sont pas capables de traiter les graphiques, et pour rendre le graphique accessible à des lecteurs ayant un handicap visuel. (Normalement, ces descriptions ne sont pas considérées comme faisant partie du document).

La manière la plus simple de procéder est d’identifier la position d’un graphique et de l’associer à un lien, comme dans l’exemple suivant :
<pb n="412"/>
<figure>
 <graphic url="p412fig.png"/>
</figure>
<pb n="413"/>
On a indiqué ici que le graphique est le fichier p412fig.png et qu’il apparaît entre les pages 412 et 413. L’élément graphic peut être utilisé partout où il y a un contenu textuel, i.e. dans un paragraphe, un titre, mais pas entre eux. Dans l’exemple suivant, l’encodeur a décidé de traiter les ornements d’une édition particulière comme un titre :
<head>
 <graphic url="http://www.iath.virginia.edu/gants/Ornaments/Heads/hp-ral02.gif"/>
</head>
Plus couramment, un graphique a au moins un titre, qui peut être encodé grâce à l’élément head. On peut également rassembler un certain nombre de figures dans une structure particulière. Et c’est souvent plus facile d’inclure une courte description de l’image. L’élément figure permet de rassembler un ou plusieurs éléments de cette sorte, ils forment alors un type de graphique appelé ‘block’.
<figure>
 <graphic url="chap3fig2.png"/>
 <head>Dick Kennedy </head>
 <figDesc>Gravure de E. Riou représentant un jeune homme assis sur une chaise, les
   pieds sur une autre et tenant à la main une canne. En arrière plan, une théière, et
   l'inscription <q>Map of Africa</q> .</figDesc>
</figure>
Ces cas doivent être soigneusement distingués du cas où un texte encodé est associé à une collection d’images numériques, qui constitue une ressource distincte. L’attribut facs permet d’associer n’importe quel élément du texte encodé à un fac-similé numérique. Dans le cas simple, quand seules des images sont disponibles, on utilise l’attribut facs dans l’élément pb pour associer chaque image à l’endroit du texte qui convient.
<text>
 <pb facs="page1.pngn="1"/>
<!-- le texte de la page 1 se trouve ici -->
 <pb facs="page2.pngn="2"/>
<!-- le texte de la page 2 se trouve ici -->
</text>

Cette méthode est valable uniquement dans les cas simples, i.e. quand chaque image numérique est contenue dans un fichier (page1.png, etc.) et correspond à une seule page transcrite et encodée. Si un alignement plus précis de l’image et de la transcription est nécessaire, par exemple, parce que les fichiers images représentent une double page, des mécanismes plus sophistiqués sont requis. On se reportera aux Recommandations.

15 L’interprétation et l’analyse

On dit souvent que tout balisage est une forme d’interprétation ou d’analyse. S’il est certainement difficile, et parfois impossible, de distinguer clairement entre des informations ‘objectives’ et des informations ‘subjectives’, et ce de manière universelle, il s’avère cependant que les jugements portant sur les secondes sont typiquement considérés comme beaucoup plus susceptibles d’alimenter des controverses que ceux portés sur les premières. Aussi, beaucoup de chercheurs notent de telles interprétations uniquement s’il est possible d’avertir le lecteur qu’elles font plus débat que d’autres parties du texte balisé. Cette section décrit quelques-uns des éléments fournis par le schéma TEI pour traiter ces différents besoins.

15.1 Les phrases « orthographiques »

Typiquement, l’interprétation parcourt l’ensemble du texte, sans respecter particulièrement telle ou telle unité structurelle. Une première étape utile consiste à segmenter le texte en unités discrètes et identifiables, chacune d’entre elles portant une étiquette servant en quelque sorte de ‘référence canonique’. Pour faciliter leur utilisation, ces unités ne doivent pas se croiser ou être emboîtées les unes dans les autres. On peut les représenter facilement en utilisant l’élément suivant :

  • s (phrase) contient une division textuelle de type phrase
Comme son nom l’indique, l’élément s est l’élément le plus couramment utilisé (dans les applications linguistiques du moins) pour indiquer les phrases « orthographiques », i.e. définies par des traits orthographiques, tels que la ponctuation. Par exemple, le début du passage de Jane Eyre, présenté plus haut, peut être divisé en de telles unités :
<pb n="474"/>
<div type="chaptern="38">
 <p>
  <s n="001">J’ai enfin épousé M. Rochester.</s>
  <s n="002">Notre mariage se fit
     sans bruit; </s>
  <s n="003">lui, moi, le ministre et le clerc, étions seuls présents.</s>
  <s n="004">Quand nous revînmes de l’église, j’entrai dans la cuisine, où Marie
     pré- parait le dîner, tandis que John nettoyait les couteaux.</s>
 </p>
 <p>
  <s n="003"> «Marie, dis-je, j’ai été mariée ce matin à M.
     Rochester. »</s>
 </p>
</div>

Notons que les éléments s ne peuvent être emboîtés : le début d’un s implique que le précédent est terminé. Quand des unités de type s sont balisées comme ci-dessus, il est conseillé de baliser la totalité du texte, de telle sorte que chaque mot du texte analysé appartiendra à un seul élément s, dont l’identifiant peut alors servir à spécifier les référence uniques à chacun de ces mots. Si les identifiants sont uniques dans le document, alors il est préférable d’utiliser l’attribut xml:id plutôt que l’attribut n (cf. exemple ci-dessus).

15.2 Les mots et la ponctuation

La segmentation du texte en mots lexicaux et non lexicaux est une opération très courante dans tous les types d’analyse textuelle, mais pas complètement triviale. Par exemple, la décision de traiter can’t en anglais ou du en français comme un ou deux mots n’est pas simple. En conséquence, il est souvent utile de rendre explicite la segmentation souhaitée. On utilise alors les éléments suivants :

  • w (mot) représente un mot grammatical (pas nécessairement orthographique)
  • pc (punctuation character) contient un caractère ou une chaîne de caractères considérés comme un signe de ponctuation unique.
Par exemple, la sortie d’un catégoriseur pourrait être encodé en TEI Lite comme suit :
<s>
 <w ana="#NAM">TreeTagger</w>
 <w ana="#VER_pres">permet</w>
 <w ana="#PRP">d'</w>
 <w ana="#VER_infi">annoter</w>
 <w ana="#PRO_IND">plusieurs</w>
 <w ana="#NOM">langues</w>
 <pc>. </pc>
</s>
Dans cet exemple, chaque mot a été pourvu automatiquement d’une catégorie, en utilisant l’attribut ana (cf. section ci-dessus). L’élément w permet aussi de noter pour chaque mot sa racine ou son lemme, soit de manière explicite, en utilisant l’attribut lemma, soit par référence, en utilisant l’attribut lemmaRef, comme dans l’exemple qui suit :
...<w ana="#VER_preslemma="permettre"
 lemmaRef="http://www.myLexicon.com/permettre">
permet</w> ...

15.3 Les éléments généraux d’interprétation

L’élément w est une spécialisation de l’élément seg, dont l’utilisation a déjà été présentée pour identifier des cibles non marquées de références croisées et des hyperliens (cf. section 8 Les références croisées et les liens) ; il spécifie une certaine portion de texte, à laquelle l’encodeur peut assigner un type utilisateur particulier, ou un identifiant unique ; il peut alors être utilisé pour marquer des caractéristiques textuelles, qui n’ont pas été prévues dans les Recommandations.

Par exemple, les Recommandations ne proposent pas d’élément ‘apostrophe’ pour marquer les parties d’un texte littéraire dans lesquelles le narrateur s’adresse directement au lecteur (ou à l’auditeur). Un traitement possible serait de considérer ces apostrophes comme des instances de l’élément q, que l’on distinguerait des autres en choisissant une valeur appropriée pour l’attribut who. Une autre solution, plus simple, et certainement plus générale, consiste à utiliser l’élément seg comme suit :
<l>Tu le connais, lecteur, ce monstre délicat,</l>
<l>
 <seg type="apostrophe">— Hypocrite lecteur, — mon semblable, — mon frère!</seg>
</l>

L’attribut type de l’élément seg peut prendre n’importe quelle valeur, et peut donc servir à marquer des phénomènes de toutes sortes ; il est de bonne pratique que d’enregistrer les valeurs utilisées et leur signification dans l’en-tête.

Un élément seg d’un type donné (à la différence de l’élément s, qui lui ressemble superficiellement) peut être enchâssé dans un élément seg de même type ou de type différent. Cela permet de représenter des structures assez complexes ; des exemples ont été proposés plus haut (8.3 Les types spéciaux de liens). Cependant, comme les éléments doivent être correctement enchâssés et ne pas se chevaucher, seg ne peut pas gérer l’association d’une interprétation avec des segments arbitraires du texte, qui ignoreraient complètement la hiérarchie du document. Il nécessite également que l’interprétation elle-même soit représentée par une valeur unique codée dans l’attribut type.

Aucune de ces contraintes ne s’applique à l’élément interp, qui offre des caractéristiques puissantes pour encoder de manière relativement directe une interprétation assez complexe.

  • interp (interprétation) interprétation sous la forme d'une annotation concise, pouvant être liée à un passage dans un texte
  • interpGrp (groupe d'interprétations) regroupe un ensemble d'interprétations ayant en commun une mention de responsabilité ou un type

Ces éléments permettent à l’encodeur de spécifier à la fois la classe de l’interprétation et une interprétation spécifique, relevant de cette classe, et que l’interprétation implique. De ce fait, tandis qu’avec seg, on peut dire simplement que quelque chose est une apostrophe, avec interp, on peut dire qu’il s’agit d’une instance (d’une apostrophe dans l’exemple) d’une classe plus grande (celle des figures de rhétorique).

En outre, interp est un élément vide, qui doit être lié au passage auquel il s’applique, au moyen de l’attribut ana, présenté ci-dessus (8.3 Les types spéciaux de liens), ou bien en utilisant son propre attribut inst. Cela signifie que n’importe quel type d’analyse peut être représenté, sans que l’on ait besoin de respecter la hiérarchie du document. Le regroupement des analyses de même type est également aisé, et ce grâce à l’élément spécifique <interGrp>.

Par exemple, supposons que l’on souhaite marquer différents aspects d’un texte, tels que des thèmes, des figures de rhétorique, et des emplacements de scènes. Différentes parties de notre extrait de Jane Eyre, par exemple, pourraient être ainsi associées.

Ces interprétations pourraient être placées n’importe où dans une partie identifiée par l’élément text. Cependant, il est de bonne pratique de les noter au même endroit (par exemple, dans une section séparée des Parties liminaires et des Annexes), comme dans l’exemple suivant :
<back>
 <div type="Interpretations">
  <p>
   <interp xml:id="set-church-1"
    resp="#LB-MSMtype="emplacement">
église</interp>
   <interp xml:id="set-kitch-1"
    resp="#LB-MSMtype="emplacement">
cuisine</interp>
   <interp xml:id="set-unspec-1"
    resp="#LB-MSMtype="emplacement">
ailleurs</interp>
  </p>
 </div>
</back>
La redondance manifeste de cet encodage peut être largement réduite en utilisant l’élément <interGrp> pour regrouper tous les éléments interp qui ont des valeurs d’attribut identiques :
<back>
 <div type="Interpretations">
  <interpGrp type="emplacement"
   resp="#LB-MSM">

   <interp xml:id="set-church">église</interp>
   <interp xml:id="set-kitch">cuisine</interp>
   <interp xml:id="set-unspec">ailleurs</interp>
  </interpGrp>
<!-- d'autres analyses -->
 </div>
</back>
Une fois ces éléments d’interprétation définis, ils peuvent être liés aux parties auxquelles ils s’appliquent, et ce de deux manières différentes : ils peuvent servir comme cibles de l’attribut ana attaché aux instances, ou bien ils peuvent eux-mêmes pointer sur les instances. Par exemple, en se servant de l'attribut global ana, on pointe du texte vers son analyse :
<div type="chapitren="38">
 <p xml:id="P38.1"
  ana="#set-church #set-kitch">
J’ai enfin épousé M. Rochester.
   Notre mariage se fit sans bruit; lui, moi, le ministre et le clerc, étions seuls
   présents. Quand nous revînmes de l’église, j’entrai dans la cuisine, où Marie pré-
   parait le dîner, tandis que John néttoyait les couteaux.</p>
</div>
Notons, dans cet exemple, que, comme le paragraphe comporte deux lieux (l’église et la cuisine), les deux identifiants ont été fournis.
Ou, pour pointer dans l'autre sens, de l'analyse vers le texte, on peut utiliser l’attribut inst de l'éléments interp ainsi :
<interpGrp type="emplacement"
 resp="#LB-MSM">

 <interp inst="#P38.1">église</interp>
 <interp inst="#P38.1resp="#LB-MSM">cuisine</interp>
</interpGrp>
L’élément interp n’est pas limité à un certain type d’analyse. L’analyse littéraire ci-dessus en est une parmi d’autres ; on pourrait également utiliser interp pour représenter une analyse linguistique en termes de parties du discours. Par exemple, la phrase proposée dans la section 8.3 Les types spéciaux de liens suppose une analyse linguistique qui pourrait être représentée comme suit :
<interp xml:id="NP1type="pos">noun phrase,
singular</interp>
<interp xml:id="VV1type="pos">inflected verb, present-tense
singular</interp> ...

16 La documentation technique

Bien que l’objet central de ce document soit l’utilisation du schéma TEI pour encoder des documents existants, on peut utiliser ce même schéma pour encoder de nouveaux documents. Dans la préparation de nouveaux documents (tels que celui-ci), XML présente de nombreux avantages : la structure du document peut être représentée clairement, et le même texte électronique peut être réutilisé à des fins très différentes - pour produire par exemple des versions hypertextes ou feuilletables en ligne, mais aussi des versions bien mises en forme, et ce à partir d’une même source.

Pour ce faire, le schéma TEI Lite comprend des éléments permettant de marquer les caractéristiques de documents techniques en général, et de documents XML en particulier.

16.1 Les éléments supplémentaires pour les documents techniques

On peut utiliser les éléments suivants pour marquer les caractéristiques particulières de documents techniques :

  • att (attribut) contient le nom d'un attribut apparaissant dans le courant du texte.
  • code contient un code littéral provenant d'un langage formel, comme un langage de programmation.
  • eg (exemple) contient toutes sortes d'exemples illustratifs.
  • formula (formule) contient une formule mathématique ou tout autre type de formule
  • gi (identifiant générique) contient le nom d'un élément.
  • ident (identifiant) contient un identifiant ou un nom dans un langage formel pour un objet quelconque.
  • val (valeur) contient une seule valeur d'attribut.
L’exemple suivant montre comment ces éléments pourraient être utilisés pour encoder le passage d’un tutoriel, qui constitue une introduction au langage de programmation Fortran :
<p>Par tradition, on introduit
une langue de programmation avec cet exemple
classique: <eg xml:space="preserve">CHAR*12 GRTG GRTG='HELLO WORLD'  PRINT *, GRTG  END</eg>
</p>
<p>Dans ce code, on voit la déclaration d'un variable <ident>GRTG</ident>:
<code>CHAR*12 GRTG</code>, qui indique que l'object <ident>GRTG</ident> contient
12 octets de type <ident>CHAR</ident>. La valeur <val>HELLO WORLD</val> est ensuite
attribuée à cette variable. </p>

On peut paramétrer une application pour qu’un texte, tel que celui présenté ci-dessus, soit correctement formaté (par exemple, en conservant les fins de ligne, en utilisant une police particulière). De même, l’utilisation de balises telles que ident facilite grandement la construction d’un index.

On utilise l’élément formula pour encadrer toute formule mathématique ou chimique, qui se présente dans un texte comme un élément distinct. Comme les formules sont généralement exprimées au moyen d’une grande diversité de signes typographiques spécifiques, ce qui n’est pas le cas des textes ordinaires, le corps de la formule doit faire l’objet d’une notation spécifique. Cette notation doit être spécifiée par l’attribut notation, comme dans l’exemple suivant :
<formula notation="tex"> \begin{math}E =
mc^{2}\end{math} </formula>
Se pose un problème quand l’encodage XML est le propos même du document technique, lui-même encodé en XML. Dans de tels documents, il est essentiel de distinguer clairement l’encodage des exemples de l’encodage du document lui-même ; dans ce type de document, la probabilité de trouver des balises de fin est alors très forte. Une solution simple consiste, pour les exemples, à utiliser la référence d’entité prédéfinie &lt; pour représenter chaque caractère < (qui marque le début d’une balise XML). Une solution plus générale consiste à spécifier que les exemples sont des données, qui ne sont pas destinées à être traitées par un analyseur. Pour ce faire, on se sert d’une construction XML particulière, appelée CDATA marked section, comme dans l’exemple suivant :
<p>Une liste peut
être balisée ainsi: <eg><![ CDATA[ <list> <item>Premier item de
la liste</item> <item>deuxième item</item> </list>]]>
</eg> L'élément <gi>list</gi> contient une série d'éléments
<gi>item</gi>
</p>

L’élément list utilisé dans l’exemple ci-dessus ne doit pas être considéré comme faisant partie du document proprement dit, parce qu’il est inséré dans une section marquée : elle commence par une déclaration spéciale de balisage <![CDATA[, et se termine par ]]>.

Notons également l’utilisation de l’élément gi pour baliser les références aux noms d’éléments (ou identifiants génériques) dans le corps du texte.

16.2 Les sections générées

Les systèmes de production de documents actuelles offrent la possibilité de générer automatiquement des sections telles que la table des matières, l'index etc. Le schéma TEI Lite propose un élément pour marquer l’endroit où une telle section doit se trouver.

L’élément divGen peut être placé à n’importe quel endroit où un élément de division serait autorisé :
<front>
 <titlePage>
<!-- ... -->
 </titlePage>
 <divGen type="toc"/>
 <div>
  <head>Preface</head>
<!-- ... -->
 </div>
</front>
<body>
<!-- ... -->
</body>
<back>
 <div>
  <head>Appendix</head>
<!-- ... -->
 </div>
 <divGen type="indexn="Index"/>
</back>

Cet exemple montre également l’utilisation de l’attribut type pour distinguer les différentes sortes de sections qui auront été générées : dans le premier cas, une table des matières (un toc), et dans le second un index.

Quand un index existant ou une table des matières doivent être encodés (plutôt que générés), on utilise l’élément list (cf. section 11 Les listes).

16.3 La génération d’index

Alors que la production d’une table des matières à partir d’un document correctement balisé ne pose généralement pas de problèmes, la production d’un index de bonne qualité demande souvent un balisage plus minutieux. Bien que l’extraction (par exemple) de toutes les occurrences des éléments term ou name puisse constituer un bon point de départ, cela peut cependant ne pas suffire.

Le schéma TEI propose une balise spécifique index, qu’on utilise pour indiquer à la fois les parties du document qui doivent être indexées, et comment l’index doit être construit.

  • index (entrée d'index) marque un emplacement à indexer dans un but quelconque.
Par exemple, le deuxième paragraphe de cette section pourrait être codé ainsi :
Le schéma TEI propose une balise spécifique
<gi>index</gi>
<index>
 <term>indexation</term>
</index>
<index>
 <term>index (balise)</term>
 <index>
  <term> generation
     d'index</term>
 </index>
</index>, qu’on utilise pour indiquer ...
L’élément index peut également être utilisé pour fournir une information de nature interprétative ou analytique. Par exemple, dans le cadre d’une étude stylistique, on voudrait enregistrer les différentes figures utilisées par Ovide dans les Métamorphoses19. Une telle étude enregistrerait les références à Jupiter (soit deus, se, et le sujet de confiteor [sous une forme fléchie codée 227], les références à Jupiter-sous-l’-apparence-d’-un-taureau (soit imago tauri fallacis et le sujet de teneo), et ainsi de suite.
<l n="3.001">iamque deus posita fallacis
imagine tauri</l>
<l n="3.002">se confessus erat Dictaeaque rura tenebat</l>

Pour ce faire, on peut utiliser l’élément note, discuté dans la section 7 Les notes, ou l’élément interp discuté dans la section 15 L’interprétation et l’analyse. Ici, on montre comment l’élément index peut aussi être utilisé.

On suppose que l’objet doit générer plus d’un index : l’un rassemblera les noms des divinités (appelé dn), un autre les références onomastiques (appelé on), un troisième les références pronominales (appelé pr), et ainsi de suite. On pourrait alors procéder de la manière suivante :
<l n="3.001">iamque deus posita fallacis
imagine tauri <index indexName="dn">
  <term>Iuppiter</term>
  <index>
   <term>deus</term>
  </index>
 </index>
 <index indexName="on">
  <term>Iuppiter (taurus)</term>
  <index>
   <term>imago tauri
       fallacis</term>
  </index>
 </index>
</l>
<l n="3.002">se confessus erat Dictaeaque
rura tenebat <index indexName="pr">
  <term>Iuppiter</term>
  <index>
   <term>se</term>
  </index>
 </index>
 <index indexName="v">
  <term>Iuppiter</term>
  <index>
   <term>confiteor
       (v227)</term>
  </index>
 </index>
</l>

Pour chaque élément index ci-dessus, une entrée sera générée dans l’index approprié. L’entrée est le contenu de l’élément term. Dans chaque cas, les éléments term, rassemblés dans l’élément index secondaire, fournissent un deuxième mot clé. La référence à proprement parler sera extraite du contexte dans lequel l’élément index apparaît, i.e. dans ce cas, l’identifiant de l’élément l qui le contient.

16.4 Les adresses

On utilise l’élément address pour baliser une adresse postale de n’importe quel type. Il contient un ou plusieurs éléments addrLine, pour chaque ligne de l’adresse. Voici un exemple simple :
<address>
 <addrLine>Centre d'Études Supérieures de la Renaissance</addrLine>
 <addrLine>59, rue Néricault-Destouches</addrLine>
 <addrLine> 37013 TOURS</addrLine>
 <addrLine>France</addrLine>
</address>
Les parties de l’adresse peuvent être distinguées en utilisant l’élément name, discuté dans la section 10.1 Les dénominations et les expressions référentielles.
<address>
 <addrLine>Centre d'Études Supérieures de la Renaissance</addrLine>
 <addrLine>59, rue Néricault-Destouches</addrLine>
 <addrLine> 37013 <name type="city">TOURS</name>
 </addrLine>
 <addrLine>
  <name type="country">France</name>
 </addrLine>
</address>

17 Les jeux de caractères, les diacritiques, etc.

Avec l’adoption par XML de l’Unicode, c’est-à-dire l'ensemble des caractères devant être utilisés dans tous les documents, la plupart des problèmes qui se posaient précédemment pour représenter la diversité des langues et des systèmes d’écriture ont été grandement réduits. Pour ceux qui travaillent avec les formes standards des langues européennes notamment, il n’y a presque rien à faire : tout éditeur XML permet de saisir directement des caractères accentués ou d’autres caractères « non ASCII ». Ces caractères doivent être stockés dans le fichier final de manière à ce qu’ils soient directement transférables entre des systèmes différents.

Dans un document XML, il y a deux exceptions importantes : les caractères & et < ne peuvent être saisis directement, car ils ont une signification particulière, celle de balise de début. Ils doivent toujours être représentés comme des références d’entité : &amp; ou &lt;.

18 Les Parties liminaires et les Annexes

18.1 Les Parties liminaires

Dans beaucoup de cas, notamment dans les textes plus anciens, les Parties liminaires, telles que les pages de titre, les messages préliminaires, etc. peuvent fournir des informations linguistiques et sociales très utiles. P5 fournit un ensemble de recommandations pour distinguer les éléments textuels les plus courants rencontrés dans les Parties liminaires. Elles sont présentées ci-dessous.

18.1.1 La page titre

Le début d’une page titre doit être balisé avec l’élément titlePage. Tout le texte contenu sur la page doit être transcrit et balisé avec les éléments figurant dans la liste suivante :

  • titlePage (page de titre) contient la page de titre d’un texte qui figure dans les parties liminaires.
  • docTitle (titre du document) contient le titre d’un document, incluant la totalité de ses composants tels qu’ils sont donnés sur la page de titre.
  • titlePart (title part) contient une section ou division du titre d’un ouvrage telle qu’elle est indiquée sur la page de titre.
  • byline (mention de responsabilité) indique la responsabilité principale pour une œuvre donnée sur la page de titre ou au début ou à la fin de l’œuvre.
  • docAuthor (auteur du document) contient le nom de l’auteur du document tel qu’il est donné sur la page de titre (ce nom est le plus souvent contenu dans une mention de responsabilité) .
  • docDate (date du document) contient la date d’un document telle qu’elle est (généralement ) donnée sur une page de titre.
  • docEdition (édition du document) contient une mention d’édition telle qu’elle figure sur la page de titre d’un document.
  • docImprint (mention d'impression) contient la mention d'impression de l'éditeur (lieu et date de publication, nom de l’éditeur), telle qu’elle est généralement donnée au bas de la page de titre.
  • epigraph (epigraph) contient une citation, anonyme ou attribuée et qui apparaît au début d’une section ou d’un chapitre ou sur une page de titre.

Quand cela est nécessaire, les variations de polices de caractères doivent être notées avec l’attribut rend, décrit ci-dessus. Les Recommandations n’offrent pas à l’heure actuelle de solutions pour décrire en détail l’interlettrage et de la dimension des caractères dans les titres ornés. On indiquera les changements de langue au moyen de l’attribut xml:lang ou de l’élément foreign. Le nom des personnes, des lieux, des organisations peut être balisé au moyen de l’élément name, partout où ils apparaissent, et si aucun autre élément plus spécifique n’est disponible.

Deux pages titre en guise d’exemple :
<titlePage rend="Roman">
 <docTitle>
  <titlePart type="main">BERENICE <hi>TRAGEDIE</hi>. </titlePart>
 </docTitle>
 <byline>PAR <docAuthor>M. RACINE.</docAuthor>
 </byline>
 <docImprint>A <name>PARIS</name>, Chez <name>Claude Barbin</name>, au Palais, sur
   le Second Perron de la Sainte Chapelle.</docImprint>
 <docDate>M. DC. LXXI</docDate>
 <imprimatur>AVEC PRIVILEGE DU ROY.</imprimatur>
</titlePage>
<titlePage>
 <docTitle>
  <titlePart type="main"> LES CHOSES</titlePart>
  <titlePart type="sub">Une histoire des années soixante </titlePart>
 </docTitle>
 <byline>PAR <docAuthor>GEORGES PEREC</docAuthor>
 </byline>
 <titlePart>Postface de <name>Jacques LEENHARDT</name>
 </titlePart>
 <docImprint>Julliard</docImprint>
</titlePage>
Comme précédemment, on utilise l’attribut ref pour associer un nom à une description plus elaborée de l'entité nommé stockée ailleurs. Par exemple :
<titlePart>Postface de <name ref="http://cral.ehess.fr/index.php?139">Jacques
   LEENHARDT</name>
</titlePart>

18.1.2 Différents types de liminaires

Les parties les plus importantes des Parties liminaires doivent être balisées comme div ; pour distinguer les différents liminaires, l’attribut type pourra avoir l’une des valeurs suivantes :

preface
Un avant-propos ou une préface qui s’adresse au lecteur, dans lequel l’auteur ou l’éditeur expose le contenu, les objectifs, l’origine du texte
dedication
Une adresse formelle ou une dédicace de l’auteur du texte à une ou plusieurs personnes ou institutions
abstract
Un résumé du contenu du texte, sous la forme d’un texte libre
ack
Les remerciements de l’auteur pour des personnes et des institutions qui ont contribué à la création du texte
contents
Une table des matières spécifiant la structure du travail et listant ses constituants. On doit utiliser l’élément list pour spécifier sa structure.
frontispiece
Un frontispice illustré, qui comprend éventuellement du texte.

Pour d’autres types de liminaires, l’encodeur peut spécifier à sa guise les autres valeurs de l’attribut type.

Comme dans n’importe quelle division textuelle, les Parties liminaires peuvent contenir des éléments structurels de bas niveau ou des éléments non structurels (cf. ci-dessus). Elles commencent généralement par un titre, qui doit être balisé au moyen de l’élément head. Les éléments suivants sont aussi disponibles pour baliser les contenus:

  • salute (formule de politesse) contient un dédicace ou une formule de salut qui précède un avant-propos ou autre division du texte; ou bien encore la formule de politesse qui conclut une lettre, une préface, etc.
  • signed (signature) contient la dernière salutation, ajoutée à un avant-propos, à une dédicace ou à une autre division du texte.
  • byline (mention de responsabilité) indique la responsabilité principale pour une œuvre donnée sur la page de titre ou au début ou à la fin de l’œuvre.
  • dateline (mention de date) contient une brève description des lieux, date, heure, etc. concernant la production d’une lettre, d’un article de journal ou d’un autre texte qui, placée au début ou à la fin, lui est associée comme en-tête ou annonce de fin.
  • argument (argument) liste formelle ou description en texte libre des sujets traités dans une subdivision d’un texte
  • cit (citation) citation provenant d'un autre document comprenant la référence bibliographique de sa source. Dans un dictionnaire il peut contenir un exemple avec au moins une occurrence du mot employé dans l’acception qui est décrite, ou une traduction du mot-clé, ou un exemple.
  • opener (formule de début) regroupe la date, la mention de responsabilité, la formule de politesse et d'autres expressions de ce type dans un groupe préliminaire au début d’une division, en particulier au commencement d’une lettre.
  • closer (formule finale) regroupe une formule de politesse, une indication d'une date et d'autres expressions semblables figurant comme expression à la fin d’une division, en particulier à la fin d’une lettre.

Les messages qui apparaissent ailleurs dans le texte, contiendront naturellement les mêmes éléments.

A titre d’exemple, prenons la préface des Essais de Michel de Montaigne (édition de 1600) ; elle pourrait être balisée comme suit :
<div type="préface">
 <head>Au Lecteur</head>
 <p>C'EST icy un Livre de bonne foy, Lecteur. Il t'advertit dès l'entrée, que je ne
   m'y suis propose aucune fin, que domestique &amp; privée .... Ainsi, Lecteur, je
   suis moy-mesme la matière de mon livre : ce n'est pas raison que tu employes ton
   loisir en un subject si frivole &amp; si vain.</p>
 <closer>
  <salute>A Dieu donc.</salute>
  <signed>De <name>Montaigne</name>, ce premier de Mars, mil cinq cês quatre
     vingts.</signed>
 </closer>
</div>

18.2 Les Annexes

18.2.1 Les divisions structurelles des Annexes

Du fait de la diversité des pratiques de publications, les Annexes peuvent contenir virtuellement tous les éléments listés dans les Parties liminaires ; quand c’est le cas, on utilise les mêmes éléments. Cependant, les Annexes peuvent aussi contenir les types indiqués ci-dessous. Comme pour les divisions structurelles du corps du texte, ils doivent être balisés par des éléments div, et distingués par les valeurs associées à l’attribut type :

appendix
Une section auxiliaire indépendante d’un travail, qui propose souvent un texte additionnel d’une certaine manière non canonique.
glossary
Une liste de termes associés chacun à une définition (glose) : elle doit être encodée avec l’élément <list type="gloss">.
notes
Une section dans laquelle des notes de toutes sortes, y compris textuelles, sont regroupées.
bibliogr
Une liste de références bibliographiques : elle doit être encodée comme une listBibl
index
Toute forme d’index préexistant au travail. (Un index peut aussi être généré pour un document. On utilise alors l’élément index décrit plus haut).
colophon
Une déclaration qui apparaît à la fin d’un livre décrivant les conditions de sa production physique.

19 La page titre électronique

Chaque texte TEI a un en-tête qui fournit une information analogue à celle qui est fournie dans la page titre d’un texte imprimé. L’en-tête est indiqué par l’élément teiHeader et est constitué de quatre parties :

Un corpus, ou un recueil de textes, qui partagent beaucoup de caractéristiques, peuvent avoir un en-tête pour le corpus, et des en-têtes individuels pour chacun des composants. Dans ce cas, l’attribut type indique le type de l’en-tête. Et l’élément <teiHeader type="corpus"> présente les informations relatives au corpus.

Certains des éléments de l’en-tête contiennent du texte libre, encodé sous la forme d’un ou plusieurs p. D’autres sont regroupés :

19.1 La description du fichier

L’élément fileDesc est obligatoire. Il contient la description bibliographique complète du fichier, et utilise les éléments suivants :

  • titleStmt (mention de titre) regroupe les informations sur le titre d’une œuvre et les personnes ou institutions responsables de son contenu intellectuel.
  • editionStmt (mention d'édition) regroupe les informations relatives à l’édition d’un texte.
  • extent (étendue) décrit la taille approximative d’un texte stocké sur son support, numérique ou non numérique, exprimé dans une unité quelconque appropriée.
  • publicationStmt (mention de publication) regroupe des informations concernant la publication ou la diffusion d’un texte électronique ou d’un autre type de texte.
  • seriesStmt (mention de collection) regroupe toute information relative à la collection (si elle existe) à laquelle appartient une publication.
  • notesStmt (mention de notes) rassemble toutes les notes fournissant des informations sur un texte, en plus des informations mentionnées dans d'autres parties de la description bibliographique.
  • sourceDesc (description de la source) décrit la source à partir de laquelle un texte électronique a été dérivé ou produit, habituellement une description bibliographique pour un texte numérisé, ou une expression comme ‘document numérique natif’ pour un texte qui n'a aucune existence précédente.
Un en-tête minimal a la structure suivante :
<teiHeader>
 <fileDesc>
  <titleStmt>
<!-- description bibliographique de la ressource -->
  </titleStmt>
  <publicationStmt>
<!-- informations sur la distribution de la ressource -->
  </publicationStmt>
  <sourceDesc>
<!-- informations sur la ou les sources d'où la ressource a été dérivé -->
  </sourceDesc>
 </fileDesc>
</teiHeader>

19.1.1 La mention du titre

Les éléments suivants peuvent être utilisés dans le titleStmt :

  • title (titre) contient le titre complet d'une oeuvre quelconque
  • author (auteur) dans une référence bibliographique contient le nom de la (des) personne(s) physique(s) ou du collectif, auteur(s) d'une oeuvre ; par exemple dans la même forme que celle utilisée par une référence bibliographique reconnue.
  • sponsor (commanditaire) indique le nom d’une institution ou d’un organisme partenaires.
  • funder (financeur) désigne le nom d’une personne ou d’un organisme responsable du financement d’un projet ou d’un texte.
  • principal (chercheur principal) contient le nom du chercheur qui est principalement responsable de la création d’un texte électronique.
  • respStmt (mention de responsabilité) indique la responsabilité quant au contenu intellectuel d'un texte, d'une édition, d'un enregistrement ou d'une publication en série, lorsque les éléments spécifiques relatifs aux auteurs, éditeurs, etc. ne suffisent pas ou ne s'appliquent pas.
Le nom d’une ressource numérique dérivée de son nom non numérique sera évidemment très proche. Cependant, il est important de distinguer le nom du fichier informatique de celui du texte de la source. Par exemple :
<titleStmt>
 <title>Artamène ou le Grand Cyrus : édition numérique</title>
 <author>Scudéry, Madeleine (1608-1701)</author>
 <respStmt>
  <resp>numérisation</resp>
  <name>Claude Bourqui</name>
  <name>Alexandre Gefen</name>
 </respStmt>
</titleStmt>

19.1.2 La mention de l’édition

Le editionStmt rassemble les informations relatives à une seule édition de la ressource numérique (« édition » étant employé dans le sens qu’il a dans une bibliographie). Il peut inclure les éléments suivants :

  • edition (édition) décrit les particularités de l’édition d’un texte.
  • respStmt (mention de responsabilité) indique la responsabilité quant au contenu intellectuel d'un texte, d'une édition, d'un enregistrement ou d'une publication en série, lorsque les éléments spécifiques relatifs aux auteurs, éditeurs, etc. ne suffisent pas ou ne s'appliquent pas.
Par exemple:
<editionStmt>
 <edition n="U2">Troisième version, avec des révisions substantielles <date>1987</date>
 </edition>
</editionStmt>

La détermination de ce qui implique l'existence d'une nouvelle édition reste de la responsabilité de l'encodeur.

19.1.3 La mention relative à la taille

La mention extent note la taille approximative de la ressource numérique.

Par exemple :
<extent>4532
octets</extent>

19.1.4 La mention de la publication

Le publicationStmt est obligatoire. Il contient soit une simple description sous la forme d’un texte libre, soit au moins l’un des trois éléments décrits ci-dessous :

  • publisher (éditeur) donne le nom de l'organisme responsable de la publication ou de la distribution d'un élément de la bibliographie.
  • distributor (diffuseur) donne le nom d’une personne ou d’un organisme responsable de la diffusion d’un texte.
  • authority (responsable de la publication.) donne le nom de la personne ou de l'organisme responsable de la publication d’un fichier électronique, autre qu’un éditeur ou un distributeur.

Chacun de ces trois éléments peuvent contenir les éléments suivants:

  • pubPlace (lieu de publication) contient le nom du lieu d'une publication.
  • address (address) contient une adresse postale ou d'un autre type, par exemple l'adresse d'un éditeur, d'un organisme ou d'une personne.
  • idno (identifiant) donne un identifiant standardisé qui peut être utilisé pour identifier une référence bibliographique, une personne, un titre d'ouvrage ou une organisation.
  • availability (disponibilité) renseigne sur la disponibilité du texte, par exemple sur toutes restrictions quant à son usage ou sa diffusion, son copyright, etc.
  • licence contient des informations légales applicables au texte, notamment le contrat de licence définissant les droits d'utilisation.
  • date (date) contient une date exprimée dans n'importe quel format.
Par exemple:
<publicationStmt>
 <authority>Université François-Rabelais</authority>
 <address>
  <addrLine>3 rue des Tanneurs</addrLine>
  <addrLine>37041 TOURS Cedex 1 France</addrLine>
 </address>
 <idno type="BVH">B360446201_B343_1</idno>
 <availability status="restricted">
  <licence target="http://creativecommons.org/licenses/by-sa/2.0/"> Ce document
     est publié librement sur le web à destination de la communauté scientifique
     dans le cadre de la licence Creative Commons « Paternité-Pas d’Utilisation
     Commerciale-Partage des Conditions Initiales à l’Identique 2.0 France ».
  </licence>
 </availability>
</publicationStmt>

19.1.5 La mention des séries et des notes

L’élément seriesStmt rassemble des informations concernant la collection ou la série, si elle existe, à laquelle la publication appartient. Il peut contenir les éléments title, idno ou des éléments respStmt.

19.1.6 La description de la source

L’élément sourceDesc est un élément obligatoire, qui enregistre toutes les spécifications de la source ou des sources, à partir desquelles le fichier informatique a été construit. Il peut contenir du texte libre, une référence bibliographique, et rassemble un ou plusieurs des éléments suivants :

  • bibl (référence bibliographique.) contient une référence bibliographique faiblement structurée dans laquelle les sous-composants peuvent ou non être explicitement balisés.
  • listBibl (liste de références bibliographiques) contient une liste de références bibliographiques de toute nature.
Par exemple :
<sourceDesc>
 <p>Texte original : le texte a été créé sous sa forme électronique.</p>
</sourceDesc>
<sourceDesc>
 <bibl>Mazelier, Roger : Gérard de Nerval et l’Humour divin, Le Mesnil Saint-Denis,
   1995.</bibl>
</sourceDesc>
<sourceDesc>
 <bibl>
  <title level="a">L'Enracinement</title>
  <author>Simone Weil</author>, <title>Prélude à une déclaration des devoirs
     envers l'être humain </title>. <publisher>Gallimard</publisher>
  <date>1968</date>. </bibl>
</sourceDesc>

19.2 La description de l’encodage

L’élément encodingDesc spécifie les méthodes et les principes éditoriaux qui ont présidé à la transcription du texte. Il est fortement recommandé de l’utiliser. Il peut contenir du texte libre ou bien des éléments de la liste suivante :

  • projectDesc (description du projet) décrit en détail le but ou l’objectif visé dans l’encodage d’un fichier électronique, ainsi que toute autre information pertinente sur la manière dont il a été construit ou recueilli.
  • samplingDecl (déclaration d'échantillonnage) contient une description en texte libre du raisonnement et des méthodes utilisés pour l'échantillonnage des textes dans la création d’un corpus ou d’une collection.
  • editorialDecl (déclaration des pratiques éditoriales) donne des précisions sur les pratiques et les principes éditoriaux appliqués au cours de l’encodage du texte.
  • refsDecl (Déclaration du système de références) précise la manière dont les références canoniques ont été construites pour ce texte.
  • classDecl (déclaration de classification) contient une ou plusieurs taxinomies définissant les codes de classification utilisés n’importe où dans le texte.

19.2.1 Les descriptions du projet et des échantillons

Illustrons les éléments projectDesc et <samplingDesc> :
<encodingDesc>
 <projectDesc>
  <p>Corpus de
     textes sélectionnés pour la formation Claremont Shakespeare Clinic, June 1990.
  </p>
 </projectDesc>
</encodingDesc>
<encodingDesc>
 <samplingDecl>
  <p>Corpus
     d'échantillons de 2000 mots pris au début de chaque texte. </p>
 </samplingDecl>
</encodingDesc>

19.2.2 Les déclarations éditoriales

L’élément editorialDecl permet de décrire (texte libre) les pratiques mises en œuvre lors de l’encodage du texte. Typiquement, cette description doit couvrir les aspects suivants, chacun faisant l’objet d’un paragraphe séparé :

correction
comment et dans quelles circonstances, on a corrigé le texte.
normalization
les types de régularisations et standardisations, qui ont été opérés.
quotation
les décisions prises en matière de guillemets. Est-ce qu’ils ont été conservés ou remplacés par des références d’entité, les guillemets ouvrants et fermants sont-ils différenciés, etc. ?
hyphenation
ce que l’on a décidé en matière de césure (notamment les césures de fins de ligne). Est-ce qu’elles ont été conservées, remplacées par des références d’entité, etc. ?
segmentation
comment le texte a été segmenté, par exemple en phrases, en unités de ton, en strates graphémiques, etc. ?
interpretation
quelles informations analytiques, interprétatives ont été associées au texte ?
Exemple :
<editorialDecl>
 <p>L'analyse
   morpho-syntaxique trouvée dans la section 4 a été ajoutée manuellement, et n'a
   pas encore été contrôllée.</p>
 <p>Contrôle des erreurs d'orthographe effectué par
   le systeme WordPerfect. </p>
 <p>Orthographe normalisée et modernisée selon
   dictionnaire Le Grand Robert.</p>
</editorialDecl>

19.2.3 Les déclarations relatives au système de référence et à la classification

On utilise l’élément refsDecl pour documenter la manière dont les schémas de référencement standard ont été construits. Dans sa forme la plus simple, l’élément contient du texte libre.

Exemple :
<refsDecl>
 <p>L'attribut
 <att>n</att> sur chaque <gi>div</gi> porte la référence canonique de cette
   division sous la forme XX.yyy : XX fournissant la numérotation du livre en
   chiffres romains, et yyy celle de la section en chiffres arabes, par ex
   II.234.</p>
</refsDecl>

L’élément classDecl regroupe les définitions ou les sources de n’importe quel schéma de classification descriptive, qui sont utilisées par les autres parties de l’en-tête. On doit fournir au moins un schéma, encodé en utilisant les éléments suivants :

  • taxonomy (taxinomie) définit une typologie soit implicitement au moyen d’une référence bibliographique, soit explicitement au moyen d’une taxinomie structurée.
  • bibl (référence bibliographique.) contient une référence bibliographique faiblement structurée dans laquelle les sous-composants peuvent ou non être explicitement balisés.
  • category (catégorie) contient une catégorie descriptive particulière, éventuellement intégrée dans une catégorie de niveau supérieur, à l’intérieur d’une taxinomie définie par l’utilisateur.
  • catDesc (Description de la catégorie) décrit une catégorie particulière à l’intérieur d’une taxinomie ou d’une typologie de texte, sous forme d’un court texte descriptif suivi ou dans les termes des paramètres contextuels utilisés dans l’élément Description du texte <textDesc>.
Dans le cas le plus simple, la taxinomie peut être définie par une référence bibliographique, comme dans l’exemple suivant :
<classDecl>
 <taxonomy xml:id="RAMEAU">
  <bibl>Répertoire d'autorité-matière encyclopédique et alphabétique unifié
     (RAMEAU) de la Bibliothèque nationale de France. <ptr target="http://rameau.bnf.fr/"/>
  </bibl>
 </taxonomy>
</classDecl>
L’encodeur peut procéder d’une autre manière, ou bien compléter ce qui précède, en définissant un schéma de classification spécifique et personel, comme dans l’exemple suivant :
<taxonomy xml:id="taxinomiePerso">
 <category xml:id="a.a">
  <catDesc>littérature</catDesc>
 </category>
 <category xml:id="a.a.1">
  <catDesc>Drame bourgeois</catDesc>
 </category>
 <category xml:id="a.a.1.α">
  <catDesc>Comédie larmoyante</catDesc>
 </category>
 <category xml:id="a.b">
  <catDesc>Correspondance</catDesc>
 </category>
 <category xml:id="a.b.1.a">
  <catDesc>Dernières lettres</catDesc>
 </category>
 <category xml:id="a.c.">
  <catDesc>Littérature européenne -- 16e siècle</catDesc>
 </category>
 <category xml:id="a.c.1">
  <catDesc>Satire de la Renaissance </catDesc>
 </category>
 <category xml:id="a.d">
  <catDesc>Récits de voyage</catDesc>
 </category>
 <category xml:id="a.d.1">
  <catDesc>Récits de la mer </catDesc>
 </category>
</taxonomy>>

Relier un texte particulier et une catégorie dans une taxinomie est réalisé grâce à l’élément catRef, inséré dans l’élément textClass. Cf. section ci-dessous.

19.3 La description du profil

L’élément profileDesc permet de caractériser la diversité des dimensions d’un texte. Il doit être enregistré dans un seul cadre et comporte trois constituants optionnels :

  • creation (création) contient des informations concernant la création d’un texte.
  • langUsage (langue utilisée) décrit les langues, variétés de langues, registres, dialectes, etc. présents à l’intérieur d’un texte.
  • textClass (classification du texte) regroupe des informations décrivant la nature ou le sujet d’un texte selon des termes issus d’un système de classification standardisé, d’un thésaurus, etc.

L’élément creation permet de documenter le lieu de la création du travail, même si celui-ci n’a pas été publié, ou bien s’il n’a pas été explicitement noté dans la source.

Exemple :
<creation>
 <date when="1992-08">August 1992</date>
 <name type="place">Taos, New
   Mexico</name>
</creation>
Quand le texte est écrit dans différentes langues, on se sert de l’élément langUsage. Celui-ci contient des éléments permettent de documenter chaque langue en particulier :
  • language (langue) caractérise une langue ou une variété de langue utilisée dans un texte.
Par exemple, un texte comportant de manière prédominante du français tel qu’il est parlé au Québec, mais aussi de plus petits passages en anglais britannique et en anglais du Canada pourrait être documenté comme suit :
<langUsage>
 <language ident="fr-CAusage="60">Québecois</language>
 <language ident="en-CAusage="20">Anglais canadien</language>
 <language ident="en-GBusage="20">Anglais britannique</language>
</langUsage>

L’élément textClass permet de classer le texte. On établit une référence vers un système de classification, localement défini par l’élément classDecl, ou bien on réfère à un schéma établi de manière externe, par exemple la Classification Décimale Universelle. Les textes peuvent être aussi classés à l’aide de listes de mots clés, qui peuvent eux-mêmes venir de listes contrôlées, définies localement, ou bien de manière externe. On utilise les éléments suivants pour établir de telles classifications :

  • classCode (code de classification) contient le code de classification attribué à ce texte en référence à un système standard de classification.
  • catRef (référence à la catégorie) spécifie une ou plusieurs catégories définies dans une taxinomie ou une typologie textuelle.
  • keywords (mot clé) contient une liste de mots clés ou d’expressions décrivant la nature ou le sujet d’un texte.
La manière la plus simple de classer un texte est d’utiliser l’élément classCode. Par exemple, un texte avec la classification 410 de la Classification Décimale Universelle pourrait être documenté comme suit :
<classCode scheme="http://www.udc.org">410</classCode>
Quand un schéma de classification a été défini localement en utilisant l’élément taxonomy, présenté dans la section précédente, l’élément <carRef> peut être utilisé pour y faire référence. Poursuivons avec un exemple proposé plus tôt, un travail répertorié dans ce corpus comme Drame bourgeois et Récits de la mer. Il pourrait être documenté comme suit :
<catRef target="#a.a.1 #a.d.1"/>
L’élément keywords contient la liste des mots clés ou des expressions qui identifient les thèmes ou la nature du texte. Comme précédemment, l’attribut scheme identifie la source de laquelle ces termes ont été extraits, par exemple du système RAMEAU, ou ailleurs. Les mots clés utilisés peuvent également être répertorié dans élément taxonomy, tel que cela été présenté ci-dessus :
<textClass>
 <keywords scheme="#fr_RAMEAU">
  <term>Littérature française -- 20ème siècle -- Histoire et critique</term>
  <term>Littérature française -- Histoire et critique -- Théorie, etc.</term>
  <term>Français (langue) -- Style -- Bases de données.</term>
 </keywords>
</textClass>

Les classifications multiples sont possibles ; elles utilisent les mécanismes décrits dans cette section.

19.4 La description des modifications

L’élément revisionDesc permet de tenir le journal des modifications. Le journal peut être conservé sous la forme d’une suite d’éléments change, chacun contenant une courte description de la modification. On utilise les attributs when et who pour spécifier quand le changement a eu lieu et qui en est responsable.

Exemple :
<revisionDesc>
 <change when="1991-03-06who="#EMB">fichier validé</change>
 <change when="1990-05-25who="#EMB">version corrigée</change>
</revisionDesc>

Dans un environnement de production, il est souvent préférable d’utiliser un système automatisé pour conserver la trace des modifications. Beaucoup de systèmes de gestion de versions peuvent être également configurés pour mettre à jour automatiquement l’en-tête TEI d’un fichier.

Annexe A Liste des éléments décrits

Le schéma TEI Lite est un sous-ensemble de la TEI P5. Dans la liste qui suit, qui rassemble des éléments et des classes qui ont été décrits ci-dessus, les informations, notamment les exemples, ont été extraites des définitions fournies dans la TEI P5, et peuvent donc renvoyer à des éléments ou des attributs qui ne sont pas proposées dans la TEI Lite. Notons cependant que seuls les éléments listés ici sont disponibles dans le schéma TEI Lite. Certaines spécifications peuvent également renvoyer à des attributs, qui, bien qu’ils soient disponibles dans la TEI Lite, n’ont pas été, par manque de place, présentés dans ce tutoriel.

Schema tei_lite: Elements

<abbr>

<abbr> (abréviation) contient une abréviation quelconque. [3.6.5. Abbreviations and Their Expansions]
Modulecore
Attributs
type(type) permet à l'encodeur de caractériser l'abréviation selon une typologie adéquate
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

L'attribut type est donné si on souhaite typer les abréviations à l'endroit où elles apparaissent ; cela peut être utile dans certaines circonstances bien qu'une abréviation conserve la même signification dans toutes ses occurrences. Comme les échantillons des valeurs le montrent, les abréviations peuvent être typées selon la méthode utilisée pour leur construction, pour leur écriture, ou le référent du terme abrégé ; la typologie utilisée dépend de l'encodeur et doit être pensée soigneusement afin de correspondre aux attentes. Pour une typologie des abréviations concernant le Moyen Anglais, voir 6.2. .

Membre du
Contenu dans
Peut contenir
Note

La balise abbr n'est pas obligatoire. Si c'est pertinent, l'encodeur peut transcrire les abréviations du texte source sans les commenter ni les baliser. Si les abréviations ne sont pas transcrites directement mais développées sans commentaires, alors l'en-tête TEI doit le mentionner.

Exemple
<choice>
 <expan>North Atlantic Treaty Organization</expan>
 <abbr cert="low">NorATO</abbr>
 <abbr cert="high">NATO</abbr>
 <abbr cert="highxml:lang="fr">OTAN</abbr>
</choice>
Exemple
<choice>
 <abbr>SPQR</abbr>
 <expan xml:lang="la">senatus populusque romanorum</expan>
</choice>
Exemple
<choice>
 <abbr>SPQR</abbr>
 <expan>senatus populusque romanorum</expan>
</choice>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element abbr
{
   att.global.attributes,
   att.typed.attribute.subtype,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   macro.phraseSeq
}

<add>

<add> ( ajout) contient des lettres, des mots ou des phrases insérés dans le texte par un auteur, un copiste, un annotateur ou un correcteur. [3.5.3. Additions, Deletions, and Omissions]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Dans une édition diplomatique souhaitant representer une source originalle, l'élément add ne sera pas utilisé pour les ajouts effectués par les éditeurs ou les encodeurs. Dans ce cas, on va préféra soit l'élément corr soit l'élément <supplied>.

Exemple
The story I am
going to relate is true as to its main facts, and as to the
consequences <add place="above">of these facts</add> from which
this tale takes its title.
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element add
{
   att.global.attributes,
   att.transcriptional.attributes,
   att.placement.attributes,
   att.typed.attributes,
   att.dimensions.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<address>

<address> (address) contient une adresse postale ou d'un autre type, par exemple l'adresse d'un éditeur, d'un organisme ou d'une personne. [3.6.2. Addresses 2.2.4. Publication, Distribution, Licensing, etc. 3.12.2.4. Imprint, Size of a Document, and Reprint Information]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
analysis: interp interpGrp
figures: figure
header: idno
linking: anchor
Note

Cet élément ne doit être utilisé que pour donner une adresse postale. A l'intérieur de cet élément, l'élément générique addrLine peut être utilisé comme élément alternatif aux éléments plus spécialisés de la classe model.addrPart class, tels que <street>, <postCode> etc.

Exemple
<address>
 <addrLine>Centre d'Études Supérieures de la Renaissance</addrLine>
 <addrLine>59, rue Néricault-Destouches</addrLine>
 <addrLine> 37013
   TOURS</addrLine>
 <addrLine>France</addrLine>
</address>
Exemple
<address>
 <country key="FR"/>
 <settlement type="city">Lyon</settlement>
 <postCode>69002</postCode>
 <district type="arrondissement">IIème</district>
 <district type="quartier">Perrache</district>
 <street>
  <num>30</num>, Cours de Verdun</street>
</address>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <classRef key="model.addrPart"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element address
{
   att.global.attributes,
   att.cmc.attributes,
   ( model.global*, ( ( model.addrPart, model.global* )+ ) )
}

<addrLine>

<addrLine> (ligne d'adresse) contient une ligne d'adresse postale. [3.6.2. Addresses 2.2.4. Publication, Distribution, Licensing, etc. 3.12.2.4. Imprint, Size of a Document, and Reprint Information]
Modulecore
Attributs
Membre du
Contenu dans
core: address
Peut contenir
Note

Les adresses peuvent être encodées soit comme une suite de lignes, soit en utilisant un jeu d'éléments de la classe model.addrPart. Les types d'adresses autres que l'adresse postale, tels que les numéros de téléphone, les courriels, ne doivent pas être inclus directement à l'intérieur d'un élément address mais peuvent être contenus dans un élément addrLine s'ils font partie de l'adresse imprimée dans un texte source.

Exemple
<address>
 <addrLine>44, avenue de la Libération</addrLine>
 <addrLine>B.P. 30687</addrLine>
 <addrLine>F 54063 NANCY CEDEX</addrLine>
 <addrLine>FRANCE</addrLine>
</address>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element addrLine { att.global.attributes, macro.phraseSeq }

<anchor>

<anchor> (point d'ancrage) attache un identifiant à un point du texte, que ce point corresponde ou non à un élément textuel. [8.4.2. Synchronization and Overlap 17.5. Correspondence and Alignment]
Modulelinking
Attributs
Membre du
Contenu dans
Peut contenirElément vide
Note

Il faut donner à cet élément un attribut global xml:id afin de spécifier un identifiant pour le point où l'élément intervient dans un document TEI. La valeur utilisée peut être choisie librement, pourvu qu'elle soit unique dans le document TEI et que le nom soit syntaxiquement valide. Les valeurs contenant des nombres ne doivent pas nécessairement former une séquence.

Exemple
<s>L'ancre est i<anchor xml:id="fr_A234"/>ci quelque part.</s>
<s>Aidez-moi à la trouver.<ptr target="#fr_A234"/>
</s>
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element anchor
{
   att.global.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   empty
}

<argument>

<argument> (argument) liste formelle ou description en texte libre des sujets traités dans une subdivision d’un texte [4.2. Elements Common to All Divisions 4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<argument>
 <p>28 janvier. J’ai le plus grand mal à me réatteler aux Faux-Monnayeurs — La Bastide. Fin mars. Besoin de couper mon travail. — Cuverville . Fin mai. Mise au net et dactylographie de cinq chapitres des Faux-Monnayeurs. — 8 juin. Achevé les Faux- Monnayeurs. — 14 juillet. Départ pour le Congo. </p>
</argument>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.global"/>
   <classRef key="model.headLike"/>
  </alternate>
  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <classRef key="model.common"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element argument
{
   att.global.attributes,
   att.cmc.attributes,
   ( ( model.global | model.headLike )*, ( ( model.common, model.global* )+ ) )
}

<att>

<att> (attribut) contient le nom d'un attribut apparaissant dans le courant du texte. [23. Documentation Elements]
Moduletagdocs
Attributs
scheme(schéma) fournit l'identifiant du schéma dans lequel ce nom est défini.
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
TEI
(Text Encoding Initiative) cet attribut fait partie du modèle TEI. [Valeur par défaut]
DBK
(Docbook) cet attribut fait partie du modèle Docbook.
XX
(inconnu) cet attribut fait partie d'un schéma inconnu.
imaginary
(imaginary) the attribute is from a non-existent scheme, for illustrative purposes only
XHTML
(XHTML) the attribute is part of the XHTML language
XML
(XML) the attribute is part of the XML language
XI
(XI) the attribute is defined in the xInclude schema
Membre du
Contenu dans
Peut contenir
XSD Name
Note

Un préfixe d'espace de noms peut être utilisé pour spécifier le schéma, comme alternative à sa spécification par l'attribut scheme : le préfixe est alors prioritaire.

Exemple
<p>La TEI définit six attributs<soCalled>globaux</soCalled> qui se nomment
<att>xml:id</att>, <att>rend</att>, <att>xml:lang</att>, <att>n</att>,
<att>xml:space</att>, et <att>xml:base</att>; <att scheme="XX">type</att>n'en fait pas
partie .</p>
Modèle de contenu
<content>
 <dataRef key="teidata.name"/>
</content>
Schéma Declaration
element att
{
   att.global.attributes,
   attribute scheme { teidata.enumerated }?,
   teidata.name
}

<author>

<author> (auteur) dans une référence bibliographique contient le nom de la (des) personne(s) physique(s) ou du collectif, auteur(s) d'une oeuvre ; par exemple dans la même forme que celle utilisée par une référence bibliographique reconnue. [3.12.2.2. Titles, Authors, and Editors 2.2.1. The Title Statement]
Modulecore
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Note

Il est conseillé d'utiliser des listes d'autorité reconnues pour trouver la forme exacte des noms de personnes, en particulier lorsque le catalogage repose sur le contenu de l'en-tête TEI. Les attributs key ou ref seront aussi employés pour donner une référence canonique documentant l'auteur concerné grâce à une autorité appropriée, comme le catalogue d'une bibliothèque ou une ressource en ligne.

Dans le cas d'une émission, cet élément sert à encoder le nom de la société ou du réseau qui diffuse le programme.

Exemple
<author>La Fayette, Marie Madeleine Pioche de la Vergne, comtesse de (1634–1693)</author>
<author>Anonyme</author>
<author> Erckmann-Chatrian</author>
<author>
 <orgName key="ARTE">Association relative à la télévision européenne</orgName>
</author>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element author
{
   att.global.attributes,
   att.naming.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq
}

<authority>

<authority> (responsable de la publication.) donne le nom de la personne ou de l'organisme responsable de la publication d’un fichier électronique, autre qu’un éditeur ou un distributeur. [2.2.4. Publication, Distribution, Licensing, etc.]
Moduleheader
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<authority>A. D.</authority>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element authority
{
   att.global.attributes,
   att.canonical.attributes,
   macro.phraseSeq.limited
}

<availability>

<availability> (disponibilité) renseigne sur la disponibilité du texte, par exemple sur toutes restrictions quant à son usage ou sa diffusion, son copyright, etc. [2.2.4. Publication, Distribution, Licensing, etc.]
Moduleheader
Attributs
status(status) donne un code caractérisant la disponibilité actuelle d’un texte.
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
free
(free) le texte est libre de droits.
unknown
(unknown) le statut du texte est inconnu.
restricted
(restricted) le texte est sous droits.
Membre du
Contenu dans
core: bibl
Peut contenir
core: p
header: licence
Note

On devrait adopter un format de codage reconnu.

Exemple
<availability status="restricted">
 <p>L' ABES a adopté le système Créative Commons pour permettre à tous ceux qui le
   souhaitent, de reproduire tout ou partie des rubriques du site de l'ABES sur support
   papier ou support électronique.</p>
</availability>
Modèle de contenu
<content>
 <alternate minOccurs="1"
  maxOccurs="unbounded">

  <classRef key="model.availabilityPart"/>
  <classRef key="model.pLike"/>
 </alternate>
</content>
Schéma Declaration
element availability
{
   att.global.attributes,
   att.declarable.attributes,
   attribute status { "free" | "unknown" | "restricted" }?,
   ( model.availabilityPart | model.pLike )+
}

<back>

<back> (texte annexe) contient tout supplément placé après la partie principale d'un texte : appendice, etc. [4.7. Back Matter 4. Default Text Structure]
Moduletextstructure
Attributs
Contenu dans
textstructure: text
Peut contenir
Note

Le modèle de contenu de l'élément back est identique à celui de l'élément front, ce qui permet de rendre compte de pratiques éditoriales qui ont évolué avec l'histoire culturelle.

Exemple
<back>
 <div n="1type="appendice">
  <head>APPENDICE I </head>
  <head>CHAPITRE XV bis </head>
  <p>Des cruautez exercées par les Turcs, et autres peuples : et nommément par les
     Espagnols, beaucoup plus barbares que les Sauvages mesmes </p>
  <p>Premierement Chalcondile en son histoire de la decadence de l'Empire des Grecs, ...</p>
 </div>
 <div n="2type="appendice">
  <head> Appendice 2</head>
  <head>Advertissement de l'autheur</head>
  <p>Outre les augmentations bien amples, et la revision beaucoup plus exacte que je n'avoye
     fait és precedentes Editions, j'ai pour le contentement des Lecteurs, plusieurs endroits
     de ceste quatrieme et derniere monstré ...</p>
 </div>
</back>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.frontPart"/>
   <classRef key="model.pLike.front"/>
   <classRef key="model.pLike"/>
   <classRef key="model.listLike"/>
   <classRef key="model.global"/>
  </alternate>
  <alternate minOccurs="0">
   <sequence>
    <classRef key="model.div1Like"/>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <classRef key="model.frontPart"/>
     <classRef key="model.div1Like"/>
     <classRef key="model.global"/>
    </alternate>
   </sequence>
   <sequence>
    <classRef key="model.divLike"/>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <classRef key="model.frontPart"/>
     <classRef key="model.divLike"/>
     <classRef key="model.global"/>
    </alternate>
   </sequence>
  </alternate>
  <sequence minOccurs="0">
   <classRef key="model.divBottomPart"/>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.divBottomPart"/>
    <classRef key="model.global"/>
   </alternate>
  </sequence>
 </sequence>
</content>
Schéma Declaration
element back
{
   att.global.attributes,
   att.declaring.attributes,
   (
      (
         model.frontPartmodel.pLike.frontmodel.pLikemodel.listLikemodel.global
      )*,
      (
         (
            model.div1Like,
            ( model.frontPart | model.div1Like | model.global )*
         )
       | ( model.divLike, ( model.frontPart | model.divLike | model.global )* )
      )?,
      ( ( model.divBottomPart, ( model.divBottomPart | model.global )* )? )
   )
}

<bibl>

<bibl> (référence bibliographique.) contient une référence bibliographique faiblement structurée dans laquelle les sous-composants peuvent ou non être explicitement balisés. [3.12.1. Methods of Encoding Bibliographic References and Lists of References 2.2.7. The Source Description 16.3.2. Declarable Elements]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Cet élément contient des éléments de type expression, ainsi qu'un jeu d'éléments de la classe model.biblPart.

Exemple
<bibl>Mazelier, Roger : Gérard de Nerval et l’Humour divin, Le Mesnil Saint-Denis,
1995.</bibl>
Exemple
<bibl>
 <title level="a">L'Enracinement</title>
 <author>Simone Weil</author>, <title>Prélude à une déclaration des devoirs envers l'être
   humain </title>. <publisher>Gallimard</publisher>
 <date>1968</date>.
</bibl>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.highlighted"/>
  <classRef key="model.pPart.data"/>
  <classRef key="model.pPart.edit"/>
  <classRef key="model.segLike"/>
  <classRef key="model.ptrLike"/>
  <classRef key="model.biblPart"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element bibl
{
   att.global.attributes,
   att.declarable.attributes,
   att.typed.attributes,
   att.sortable.attributes,
   att.cmc.attributes,
   (
      text
    | model.gLikemodel.highlightedmodel.pPart.datamodel.pPart.editmodel.segLikemodel.ptrLikemodel.biblPartmodel.global
   )*
}

<biblScope>

<biblScope> (extension d'une référence bibliographique) définit l'extension d'une référence bibliographique, comme par exemple une liste de numéros de page, ou le nom d'une subdivision d'une oeuvre plus grande. [3.12.2.5. Scopes and Ranges in Bibliographic Citations]
Modulecore
Attributs
Membre du
Contenu dans
core: bibl
header: seriesStmt
Peut contenir
Note

When a single page is being cited, use the from and to attributes with an identical value. When no clear endpoint is provided, the from attribute may be used without to; for example a citation such as ‘p. 3ff’ might be encoded <biblScope from="3">p. 3ff</biblScope>.

It is now considered good practice to supply this element as a sibling (rather than a child) of <imprint>, since it supplies information which does not constitute part of the imprint.

Exemple
<biblScope>pp 12–34</biblScope>
<biblScope unit="pagefrom="12to="34"/>
<biblScope unit="volume">II</biblScope>
<biblScope unit="page">12</biblScope>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element biblScope
{
   att.global.attributes,
   att.citing.attributes,
   macro.phraseSeq
}

<body>

<body> (corps du texte) contient la totalité du corps d’un seul texte simple, à l’exclusion de toute partie pré- ou post-liminaire. [4. Default Text Structure]
Moduletextstructure
Attributs
Contenu dans
textstructure: text
Peut contenir
Exemple
<body>
 <l>Nu scylun hergan hefaenricaes uard</l>
 <l>metudæs maecti end his modgidanc</l>
 <l>uerc uuldurfadur sue he uundra gihuaes</l>
 <l>eci dryctin or astelidæ</l>
 <l>he aerist scop aelda barnum</l>
 <l>heben til hrofe haleg scepen.</l>
 <l>tha middungeard moncynnæs uard</l>
 <l>eci dryctin æfter tiadæ</l>
 <l>firum foldu frea allmectig</l>
 <trailer>primo cantauit Cædmon istud carmen.</trailer>
</body>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="0">
   <classRef key="model.divTop"/>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.global"/>
    <classRef key="model.divTop"/>
   </alternate>
  </sequence>
  <sequence minOccurs="0">
   <classRef key="model.divGenLike"/>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.global"/>
    <classRef key="model.divGenLike"/>
   </alternate>
  </sequence>
  <alternate>
   <sequence minOccurs="1"
    maxOccurs="unbounded">

    <classRef key="model.divLike"/>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <classRef key="model.global"/>
     <classRef key="model.divGenLike"/>
    </alternate>
   </sequence>
   <sequence minOccurs="1"
    maxOccurs="unbounded">

    <classRef key="model.div1Like"/>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <classRef key="model.global"/>
     <classRef key="model.divGenLike"/>
    </alternate>
   </sequence>
   <sequence>
    <sequence minOccurs="1"
     maxOccurs="unbounded">

     <alternate minOccurs="1maxOccurs="1">
      <elementRef key="schemaSpec"/>
      <classRef key="model.common"/>
     </alternate>
     <classRef key="model.global"
      minOccurs="0maxOccurs="unbounded"/>

    </sequence>
    <alternate minOccurs="0">
     <sequence minOccurs="1"
      maxOccurs="unbounded">

      <classRef key="model.divLike"/>
      <alternate minOccurs="0"
       maxOccurs="unbounded">

       <classRef key="model.global"/>
       <classRef key="model.divGenLike"/>
      </alternate>
     </sequence>
     <sequence minOccurs="1"
      maxOccurs="unbounded">

      <classRef key="model.div1Like"/>
      <alternate minOccurs="0"
       maxOccurs="unbounded">

       <classRef key="model.global"/>
       <classRef key="model.divGenLike"/>
      </alternate>
     </sequence>
    </alternate>
   </sequence>
  </alternate>
  <sequence minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divBottom"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element body
{
   att.global.attributes,
   att.declaring.attributes,
   (
      model.global*,
      ( ( model.divTop, ( model.global | model.divTop )* )? ),
      ( ( model.divGenLike, ( model.global | model.divGenLike )* )? ),
      (
         ( ( model.divLike, ( model.global | model.divGenLike )* )+ )
       | ( ( model.div1Like, ( model.global | model.divGenLike )* )+ )
       | (
            ( ( ( schemaSpec | model.common ), model.global* )+ ),
            (
               ( ( model.divLike, ( model.global | model.divGenLike )* )+ )
             | ( ( model.div1Like, ( model.global | model.divGenLike )* )+ )
            )?
         )
      ),
      ( ( model.divBottom, model.global* )* )
   )
}

<byline>

<byline> (mention de responsabilité) indique la responsabilité principale pour une œuvre donnée sur la page de titre ou au début ou à la fin de l’œuvre. [4.2.2. Openers and Closers 4.5. Front Matter]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Note

La mention de reponsabilité sur une page de titre peut inclure, soit le nom, soit la description de l'auteur d'un document. Lorsque le nom y est donné, on peut éventuellement l'encoder au moyen de l'élément docAuthor.

Exemple
<byline>écrit par Costals sur le feuillet blanc de cette lettre : " cette correspondance n'
était pour vous qu' un jeu. "</byline>
Exemple
<byline>extraits de Villoison et de Schlegel. Commencé la rédaction du quatrième
livre.</byline>
Exemple
<byline>Reportage céleste de notre envoyé spécial au paradis</byline>
Exemple
<dateline>Zagreb :</dateline>
<byline>de notre envoyé spécial.</byline>
Exemple
<byline>Par le docteur <docAuthor>Martin Becanus</docAuthor>, au tome troisiesme de ses
opuscules</byline>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <elementRef key="docAuthor"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element byline
{
   att.global.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.phrase | docAuthor | model.global )*
}

<catDesc>

<catDesc> (Description de la catégorie) décrit une catégorie particulière à l’intérieur d’une taxinomie ou d’une typologie de texte, sous forme d’un court texte descriptif suivi ou dans les termes des paramètres contextuels utilisés dans l’élément Description du texte <textDesc>. [2.3.7. The Classification Declaration]
Moduleheader
Attributs
Contenu dans
header: category
Peut contenir
Exemple
<catDesc>Texte documentaire</catDesc>
Exemple
<category>
 <catDesc>genre</catDesc>
 <category>
  <catDesc>Géneral</catDesc>
 </category>
 <category>
  <catDesc>Journal</catDesc>
 </category>
 <category>
  <catDesc>Manuel technique</catDesc>
 </category>
</category>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.limitedPhrase"/>
  <classRef key="model.catDescPart"/>
 </alternate>
</content>
Schéma Declaration
element catDesc
{
   att.global.attributes,
   att.canonical.attributes,
   ( text | model.limitedPhrase | model.catDescPart )*
}

<category>

<category> (catégorie) contient une catégorie descriptive particulière, éventuellement intégrée dans une catégorie de niveau supérieur, à l’intérieur d’une taxinomie définie par l’utilisateur. [2.3.7. The Classification Declaration]
Moduleheader
Attributs
Contenu dans
Peut contenir
core: desc gloss
Exemple
<category xml:id="fr_tax.a.d2">
 <catDesc>Récits de voyage</catDesc>
</category>
<bibl>indexation selon le système d'indexation RAMEAU, géré par la Bibliothèque nationale de
France</bibl>
Exemple
<category xml:id="fr_b1">
 <catDesc>Devinettes et énigmes </catDesc>
 <category xml:id="fr_b11">
  <catDesc>Anagrammes </catDesc>
 </category>
</category>
Exemple
<category xml:id="LIT">
 <catDesc xml:lang="pl">literatura piękna</catDesc>
 <catDesc xml:lang="en">fiction</catDesc>
 <category xml:id="LPROSE">
  <catDesc xml:lang="pl">proza</catDesc>
  <catDesc xml:lang="en">prose</catDesc>
 </category>
 <category xml:id="LPOETRY">
  <catDesc xml:lang="pl">poezja</catDesc>
  <catDesc xml:lang="en">poetry</catDesc>
 </category>
 <category xml:id="LDRAMA">
  <catDesc xml:lang="pl">dramat</catDesc>
  <catDesc xml:lang="en">drama</catDesc>
 </category>
</category>
Modèle de contenu
<content>
 <sequence>
  <alternate>
   <elementRef key="catDescminOccurs="1"
    maxOccurs="unbounded"/>

   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.descLike"/>
    <elementRef key="equiv"/>
    <elementRef key="gloss"/>
   </alternate>
  </alternate>
  <elementRef key="categoryminOccurs="0"
   maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element category
{
   att.global.attributes,
   ( ( catDesc+ | ( model.descLike | equiv | gloss )* ), category* )
}

<catRef>

<catRef> (référence à la catégorie) spécifie une ou plusieurs catégories définies dans une taxinomie ou une typologie textuelle. [2.4.3. The Text Classification]
Moduleheader
Attributs
schemeidentifie le schéma de classification dans lequel est défini le jeu de catégories concerné.
Statut Optionel
Type de données teidata.pointer
Contenu dans
header: textClass
Peut contenirElément vide
Note

L'attribut scheme n'est donné que si plus d'une taxinomie a été déclarée.

Exemple
<catRef scheme="#mesTopos"
 target="#fr_lex #fr_dict #fr_gloss"/>

<!-- ailleurs dans le document -->
<taxonomy xml:id="mesTopos">
 <category xml:id="fr_lexique">
  <catDesc>Lexique</catDesc>
 </category>
 <category xml:id="fr_dict">
  <catDesc>Dictionnaire</catDesc>
 </category>
 <category xml:id="fr_gloss">
  <catDesc>Glossaire</catDesc>
 </category>
</taxonomy>
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element catRef
{
   att.global.attributes,
   att.pointing.attributes,
   attribute scheme { teidata.pointer }?,
   empty
}

<cell>

<cell> (cellule) contient une cellule d'un tableau. [15.1.1. TEI Tables]
Modulefigures
Attributs
Contenu dans
figures: row
Peut contenir
Exemple
<row>
 <cell role="label">Comportement général</cell>
 <cell role="data">Non satisfaisant, à cause de son inexactitude et de son
   inconséquence</cell>
</row>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element cell
{
   att.global.attributes,
   att.tableDecoration.attributes,
   macro.specialPara
}

<change>

<change> (change) résume une modification ou une correction apportée à une version particulière d’un texte électronique partagé entre plusieurs chercheurs. [2.6. The Revision Description 2.4.1. Creation 12.7. Identifying Changes and Revisions]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
target(target) points to one or more elements that belong to this change.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Contenu dans
header: revisionDesc
Peut contenir
Note

Les modifications doivent être enregistrées dans l'ordre, par exemple la plus récente en premier.

Exemple
<titleStmt>
 <title> ... </title>
 <editor xml:id="fr_GK">G.K.</editor>
 <respStmt xml:id="fr_RT">
  <resp>copie</resp>
  <name>R.T.</name>
 </respStmt>
</titleStmt>
<revisionDesc>
 <change who="#fr_RTwhen="2008-02-02">Fin du chapitre 23</change>
 <change who="#fr_RTwhen="2008-01-02">FIn du chapitre 2</change>
 <change n="P2.2when="1991-12-21"
  who="#fr_GK">
Ajout d'exemples dans la section 3</change>
 <change when="1991-11-11who="#fr_MSM">Suppression du chapitre 10</change>
</revisionDesc>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element change
{
   att.ascribed.attributes,
   att.datable.attributes,
   att.global.attributes,
   att.typed.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   attribute target { list { teidata.pointer+ } }?,
   macro.specialPara
}

<choice>

<choice> (choix) regroupe un certain nombre de balisages alternatifs possibles pour un même endroit dans un texte. [3.5. Simple Editorial Changes]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Parce que les éléments contenus par un élément choice correspondent tous à des solutions possibles pour encoder la même séquence, il est naturel de les envisager comme exclusifs les uns des autres. Toutefois il peut y avoir des cas où la pleine représentation d'un texte requiert de considérer ces encodages alternatifs comme parallèles.

A Noter aussi que les choice peuvent s'imbriquer.

Pour une version de choice spécialisée pour l'encodage de témoins multiples d'une même oeuvre, l'élément <app> peut etre préférable : voir la section 13.1. The Apparatus Entry, Readings, and Witnesses.

Exemple

L'encodage d'une édition des Essais pourra faire état à la fois des formes originales et des formes modernisées correspondantes:.

<p>Ainsi lecteur, je suis<choice>
  <orig>moy-mesmes</orig>
  <reg>moi-même</reg>
 </choice> la matière de mon livre : ce n'est pas raison que tu emploies ton loisir en un <choice>
  <orig>subject</orig>
  <reg>sujet</reg>
 </choice>si frivole et si vain.</p>
Modèle de contenu
<content>
 <alternate minOccurs="2"
  maxOccurs="unbounded">

  <classRef key="model.choicePart"/>
  <elementRef key="choice"/>
 </alternate>
</content>
Schéma Declaration
element choice
{
   att.global.attributes,
   att.cmc.attributes,
   ( model.choicePart | choice ),
   ( model.choicePart | choice ),
   ( model.choicePart | choice )*
}

<cit>

<cit> (citation) citation provenant d'un autre document comprenant la référence bibliographique de sa source. Dans un dictionnaire il peut contenir un exemple avec au moins une occurrence du mot employé dans l’acception qui est décrite, ou une traduction du mot-clé, ou un exemple. [3.3.3. Quotation 4.3.1. Grouped Texts 10.3.5.1. Examples]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<cit>
 <quote>Regarde de tous tes yeux, regarde</quote>
 <bibl>Jules Verne, Michel Strogof</bibl>
</cit>
Exemple
<entry>
 <form>
  <orth>to horrify</orth>
 </form>
 <cit type="translationxml:lang="en">
  <quote>horrifier</quote>
 </cit>
 <cit type="example">
  <quote>she was horrified at the expense.</quote>
  <cit type="translationxml:lang="en">
   <quote>elle était horrifiée par la dépense.</quote>
  </cit>
 </cit>
</entry>
Exemple
<cit type="example">
 <quote xml:lang="mix">Ka'an yu tsa'a Pedro.</quote>
 <media url="soundfiles-gen:S_speak_1s_on_behalf_of_Pedro_01_02_03_TS.wav"
  mimeType="audio/wav"/>

 <cit type="translation">
  <quote xml:lang="en">I'm speaking on behalf of Pedro.</quote>
 </cit>
 <cit type="translation">
  <quote xml:lang="es">Estoy hablando de parte de Pedro.</quote>
 </cit>
</cit>
Modèle de contenu
<content>
 <alternate minOccurs="1"
  maxOccurs="unbounded">

  <classRef key="model.biblLike"/>
  <classRef key="model.egLike"/>
  <classRef key="model.entryPart"/>
  <classRef key="model.global"/>
  <classRef key="model.graphicLike"/>
  <classRef key="model.ptrLike"/>
  <classRef key="model.attributable"/>
  <elementRef key="pc"/>
  <elementRef key="q"/>
 </alternate>
</content>
Schéma Declaration
element cit
{
   att.global.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   (
      model.biblLikemodel.egLikemodel.entryPartmodel.globalmodel.graphicLikemodel.ptrLikemodel.attributablepcq
   )+
}

<classCode>

<classCode> (code de classification) contient le code de classification attribué à ce texte en référence à un système standard de classification. [2.4.3. The Text Classification]
Moduleheader
Attributs
schemeidentifie le système de classification ou la taxinomie utilisée.
Statut Requis
Type de données teidata.pointer
Contenu dans
header: textClass
Peut contenir
Exemple
<classCode scheme="http://www.udc.org">410</classCode>
Exemple
<classCode scheme="http://www.oclc.org/">801</classCode>
<bibl>classification Dewey</bibl>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element classCode
{
   att.global.attributes,
   attribute scheme { teidata.pointer },
   macro.phraseSeq.limited
}

<classDecl>

<classDecl> (déclaration de classification) contient une ou plusieurs taxinomies définissant les codes de classification utilisés n’importe où dans le texte. [2.3.7. The Classification Declaration 2.3. The Encoding Description]
Moduleheader
Attributs
Membre du
Contenu dans
header: encodingDesc
Peut contenir
header: taxonomy
Exemple
<classDecl>
 <taxonomy xml:id="RAMEAU">
  <bibl>Répertoire d'autorité-matière encyclopédique et alphabétique unifié
     (RAMEAU) de la Bibliothèque nationale de France. <ptr target="http://rameau.bnf.fr/"/>
  </bibl>
 </taxonomy>
</classDecl>
<!-- ... -->
<textClass>
 <keywords scheme="#RAMEAU">
  <term>Bien et mal -- Enseignement coranique</term>
 </keywords>
</textClass>
Modèle de contenu
<content>
 <elementRef key="taxonomyminOccurs="1"
  maxOccurs="unbounded"/>

</content>
Schéma Declaration
element classDecl { att.global.attributes, taxonomy+ }

<closer>

<closer> (formule finale) regroupe une formule de politesse, une indication d'une date et d'autres expressions semblables figurant comme expression à la fin d’une division, en particulier à la fin d’une lettre. [4.2.2. Openers and Closers 4.2. Elements Common to All Divisions]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<div type="letter">
 <p> N'y voyez que le signe de l'intérêt que je que je porte à une profession qui fut la
   mienne. Je désire en effet, insérer votre article dans un ouvrage sur la presse
   française contemporaine. </p>
 <closer>
  <salute>Veuillez agréer, je vous prie, Monsieur, l'assurance de mes sentiments les
     meilleurs. </salute>
  <signed> Françoise Giroud</signed>
 </closer>
</div>
Exemple
<div type="chapter">
 <p>Voilà, cher Rhedi, ce que j' appelle le droit public. Voilà le droit des gens, ou
   plutôt celui de la raison. </p>
 <closer>
  <dateline>
   <name type="place">à Paris </name>, <date>le 4 de la lune de Zilhagé, 1716. </date>
  </dateline>
 </closer>
</div>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <elementRef key="signed"/>
  <elementRef key="dateline"/>
  <elementRef key="salute"/>
  <classRef key="model.phrase"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element closer
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      text
    | model.gLikesigneddatelinesalutemodel.phrasemodel.global
   )*
}

<code>

<code> contient un code littéral provenant d'un langage formel, comme un langage de programmation. [23.1.1. Phrase Level Terms]
Moduletagdocs
Attributs
lang(langage formel) nom identifiant le langage formel dans lequel le code est exprimé
Statut Optionel
Type de données teidata.word
Membre du
Contenu dans
Peut contenirDes données textuelles uniquement
Exemple
<code lang="JAVA"> Size fCheckbox1Size = new Size();
fCheckbox1Size.Height = 500;
fCheckbox1Size.Width = 500;
xCheckbox1.setSize(fCheckbox1Size);
</code>
Modèle de contenu
<content>
 <textNode/>
</content>
Schéma Declaration
element code { att.global.attributes, attribute lang { teidata.word }?, text }

<corr>

<corr> (correction) contient la forme correcte d'un passage qui est considéré erroné dans la copie du texte. [3.5.1. Apparent Errors]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple

Si l'on veut mettre l'accent sur le fait que le texte a été corrigé, corr seul sera employé:

Tel est le
chat Rutterkin des sorcières Margaret et Filippa Flower, qui
furent <corr>brûlées</corr> à Lincoln, le 11 mars 1619, pour avoir envoûté un parent du comte de
Rutland.
Exemple

Il est aussi possible d'associer choice etsic, pour donner une lecture incorrecte :

Tel est le
chat Rutterkin des sorcières Margaret et Filippa Flower, qui furent<choice>
 <sic>prûlées</sic>
 <corr>brûlées</corr>
</choice> à Lincoln, le 11 mars 1619, pour avoir envoûté un parent du comte de
Rutland.
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element corr
{
   att.global.attributes,
   att.editLike.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<creation>

<creation> (création) contient des informations concernant la création d’un texte. [2.4.1. Creation 2.4. The Profile Description]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
header: profileDesc
Peut contenir
Note

L’élément creation peut être utilisé pour détailler des éléments concernant l’origine du texte, c’est-à-dire sa date et son lieu de composition ; on ne doit pas le confondre avec l'élément publicationStmt qui contient la date et le lieu de publication.

Exemple
<creation>
 <date>Avant 1987</date>
</creation>
Exemple
<creation>
 <date when="1988-07-10">10 Juillet 1988</date>
</creation>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.limitedPhrase"/>
  <elementRef key="listChange"/>
 </alternate>
</content>
Schéma Declaration
element creation
{
   att.global.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   ( text | model.limitedPhrase | listChange )*
}

<date>

<date> (date) contient une date exprimée dans n'importe quel format. [3.6.4. Dates and Times 2.2.4. Publication, Distribution, Licensing, etc. 2.6. The Revision Description 3.12.2.4. Imprint, Size of a Document, and Reprint Information 16.2.3. The Setting Description 14.4. Dates]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<date when="1980-02">au début de février 1980</date>
Exemple
<date when="1654-11-23">L'an de grâce 1654,<lb/> Lundi, 23 novembre, jour de saint Clément,
pape et martyr et autres au martyrologe, <lb/>Veille de saint Chrysogone, martyr, et
autres, <lb/> Depuis environ dix heures et demie du soir jusques environ minuit et
demi.</date>
Exemple
<date when="1990-09">septembre mcmxc</date>
<date when="--09">septembre</date>
<date when="2001-09-11T12:48:00">11 septembre, neuf heures moins douze GMT</date>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element date
{
   att.global.attributes,
   att.canonical.attributes,
   att.datable.attributes,
   att.calendarSystem.attributes,
   att.editLike.attributes,
   att.dimensions.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.phrase | model.global )*
}

<dateline>

<dateline> (mention de date) contient une brève description des lieux, date, heure, etc. concernant la production d’une lettre, d’un article de journal ou d’un autre texte qui, placée au début ou à la fin, lui est associée comme en-tête ou annonce de fin. [4.2.2. Openers and Closers]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<dateline>Avignon, le 11 février. </dateline>
Exemple
<div type="chapter">
 <p>Et, sur cet océan bourdonnant de mille vaguelettes, se leva l'armée caressante et si
   tendre des merveilleuses sirènes blondes aux seins durs comme ça. </p>
 <closer>
  <dateline>
   <name type="place">Thionne-Paris</name>, <date>1950-1951.</date>
  </dateline>
 </closer>
</div>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.global"/>
  <elementRef key="docDate"/>
 </alternate>
</content>
Schéma Declaration
element dateline
{
   att.global.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.phrase | model.global | docDate )*
}

<del>

<del> (suppression) contient une lettre, un mot ou un passage supprimé, marqué comme supprimé, sinon indiqué comme superflu ou erroné dans le texte par un auteur, un copiste, un annotateur ou un correcteur. [3.5.3. Additions, Deletions, and Omissions]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Cf. gap.

Les degrés d'incertitude sur ce qui est encore lisible peuvent être indiqués par l'emploi de l'élément <certainty> (voir 22. Certainty, Precision, and Responsibility).

Cet élément doit être utilisé pour la suppression de courtes séquences de texte, généralement des mots ou des expressions. Il faut utiliser l'élément <delSpan> pour les séquences de texte plus longues, celles qui contiennent des divisions structurelles, et celles qui contiennent un chevauchement d'ajouts et de suppressions.

Le texte supprimé doit être au moins partiellement lisible, afin que l'encodeur soit en mesure de le transcrire. La partie illisible du texte à l'intérieur d'une suppression peut être marquée au moyen de la balise gap pour signaler la présence de texte non transcrit. La quantité de texte omise, la raison de l'omission, etc., peuvent être indiquées au moyen des attributs de l'élément gap. Si le texte n'est pas entièrement lisible, l'élément unclear (disponible avec le jeu additionnel de balises pour la transcription des sources primaires) doit être utilisé pour signaler les zones de texte ne pouvant pas être lues de manière fiable. Voir les sections suivantes 12.3.1.7. Text Omitted from or Supplied in the Transcription et, pour l'association étroite entre les balises del et gap, <damage>, unclear et <supplied> (ces trois dernières balises étant disponibles avec le jeu additionnel de balises pour la transcription de sources primaires), voir la section 12.3.3.2. Use of the gap, del, damage, unclear, and supplied Elements in Combination.

La balise del ne doit pas être utilisée pour les suppressions par des éditeurs scientifiques ou des encodeurs. Dans ce cas, il faut utiliser soit la balise corr, soit la balise gap.

Exemple
<l>
 <del rend="overtyped">Mein</del> Frisch <del rend="overstriketype="primary">schwebt</del>
weht der Wind
</l>
Exemple
<p>[...] mais il y reste quelque chose de mystérieux, de furtif. <del rend="overtyped">Je</del> On cesse un instant d'y penser; <del rend="overstrike">les </del>mes yeux se
ferment ou <del rend="overstrike">s'attardent sur </del> se détournent sur un livre... On
relève la tête: il est là </p>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element del
{
   att.global.attributes,
   att.transcriptional.attributes,
   att.typed.attributes,
   att.dimensions.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<desc>

<desc> (description) contient une courte description de l'objet documenté par son élément parent, qui comprend son utilisation prévue, son but, ou son application là où c'est approprié. [23.4.1. Description of Components]
Modulecore
Attributs
typecaractérise l'élément en utilisant n'importe quel système ou typologie de classification approprié.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
<dataSpec module="tei"
 ident="teidata.pointvalidUntil="2050-02-25">

 <desc type="deprecationInfo"
  versionDate="2018-09-14xml:lang="en">
Several standards bodies, including NIST in the USA,
   strongly recommend against ending the representation of a number
   with a decimal point. So instead of <q>3.</q> use either <q>3</q>
   or <q>3.0</q>.</desc>
<!-- ... -->
</dataSpec>
Membre du
Contenu dans
Peut contenir
Note

La convention TEI exige que cela soit exprimé sous la forme d'une proposition finie, introduite par un verbe actif.

Exemple
<desc>contient une description brève de la raison d'être et du champ d'application d'un
élément, d'un attribut ou de la valeur d'un attribut, d'une classe ou une entité.</desc>
SchematronA desc with a type of deprecationInfo should only occur when its parent element is being deprecated. Furthermore, it should always occur in an element that is being deprecated when desc is a valid child of that element.

<sch:rule context="tei:desc[ @type eq 'deprecationInfo']">
<sch:assert test="../@validUntil">Information about a
deprecation should only be present in a specification element
that is being deprecated: that is, only an element that has a
@validUntil attribute should have a child <desc
type="deprecationInfo">.</sch:assert>
</sch:rule>
Modèle de contenu
<content>
 <macroRef key="macro.limitedContent"/>
</content>
Schéma Declaration
element desc
{
   att.global.attributes,
   att.translatable.attributes,
   att.typed.attribute.subtype,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   macro.limitedContent
}

<distributor>

<distributor> (diffuseur) donne le nom d’une personne ou d’un organisme responsable de la diffusion d’un texte. [2.2.4. Publication, Distribution, Licensing, etc.]
Moduleheader
Attributs
Membre du
Contenu dans
core: bibl
Peut contenir
Exemple
<distributor>Laboratoire : Analyse et Traitement Informatique de la Langue Française)</distributor>
<distributor>Centre National de la Recherche Scientifique</distributor>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element distributor
{
   att.global.attributes,
   att.canonical.attributes,
   macro.phraseSeq
}

<div>

<div> (division du texte) contient une subdivision dans le texte préliminaire, dans le corps d’un texte ou dans le texte postliminaire. [4.1. Divisions of the Body]
Moduletextstructure
Attributs
Membre du
Contenu dans
textstructure: back body div front
Peut contenir
Exemple
<body>
 <div type="oeuvre">
  <head>Les Chouans </head>
  <div n="1type="partie">
   <head> Première partie</head>
   <head> L'embuscade</head>
   <div n="1type="chapitre">
    <head>Chapitre premier </head>
    <div n="1">
     <head>I</head>
     <p>Dans les premiers jours de l'an VIII, au commencement de vendémiaire, ou, pour
           se conformer au calendrier actuel, vers la fin du mois de septembre 1799, une
           centaine de paysans et un assez grand nombre de bourgeois, partis le matin de
           Fougères pour se rendre à Mayenne, gravissaient la montagne de la Pèlerine,
           située à mi-chemin environ de Fougères à Ernée, petite ville où les voyageurs
           ont coutume de se reposer. </p>
    </div>
   </div>
  </div>
 </div>
</body>
Schematron

<sch:rule context="tei:div">
<sch:report test="(ancestor::tei:l or ancestor::tei:lg) and not(ancestor::tei:floatingText)"> Abstract model violation: Lines may not contain higher-level structural elements such as div, unless div is a descendant of floatingText.
</sch:report>
</sch:rule>
Schematron

<sch:rule context="tei:div">
<sch:report test="(ancestor::tei:p or ancestor::tei:ab) and not(ancestor::tei:floatingText)"> Abstract model violation: p and ab may not contain higher-level structural elements such as div, unless div is a descendant of floatingText.
</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divTop"/>
   <classRef key="model.global"/>
  </alternate>
  <sequence minOccurs="0">
   <alternate>
    <sequence minOccurs="1"
     maxOccurs="unbounded">

     <alternate>
      <classRef key="model.divLike"/>
      <classRef key="model.divGenLike"/>
     </alternate>
     <classRef key="model.global"
      minOccurs="0maxOccurs="unbounded"/>

    </sequence>
    <sequence>
     <sequence minOccurs="1"
      maxOccurs="unbounded">

      <alternate minOccurs="1"
       maxOccurs="1">

       <elementRef key="schemaSpec"/>
       <classRef key="model.common"/>
      </alternate>
      <classRef key="model.global"
       minOccurs="0maxOccurs="unbounded"/>

     </sequence>
     <sequence minOccurs="0"
      maxOccurs="unbounded">

      <alternate>
       <classRef key="model.divLike"/>
       <classRef key="model.divGenLike"/>
      </alternate>
      <classRef key="model.global"
       minOccurs="0maxOccurs="unbounded"/>

     </sequence>
    </sequence>
   </alternate>
   <sequence minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.divBottom"/>
    <classRef key="model.global"
     minOccurs="0maxOccurs="unbounded"/>

   </sequence>
  </sequence>
 </sequence>
</content>
Schéma Declaration
element div
{
   att.global.attributes,
   att.divLike.attributes,
   att.typed.attributes,
   att.declaring.attributes,
   att.written.attributes,
   (
      ( model.divTop | model.global )*,
      (
         (
            (
               ( ( ( model.divLike | model.divGenLike ), model.global* )+ )
             | (
                  ( ( ( schemaSpec | model.common ), model.global* )+ ),
                  ( ( ( model.divLike | model.divGenLike ), model.global* )* )
               )
            ),
            ( ( model.divBottom, model.global* )* )
         )?
      )
   )
}

<divGen>

<divGen> (division de texte générée automatiquement) indique l'emplacement où doit apparaître une division du texte générée automatiquement par une application de traitement de texte. [3.9.2. Index Entries]
Modulecore
Attributs
typeprécise le type de section de texte qui apparaîtra par génération automatique (par exemple : index, table des matières, etc.)
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

Les valeurs de cet attribut dépendent de l'application utilisée ; celles qui sont données ci-dessus sont utiles dans le processus de production du document XML, mais leur liste n'est en aucun cas exhaustive.

Membre du
Contenu dans
textstructure: back body div front
Peut contenir
core: head
Note

Cet élément est plutôt utilisé pendant la production ou la manipulation du document TEI, que dans le processus de transcription de documents préexistants ; il permet de spécifier à quel endroit du document les index, tables des matières, etc., devront être générés par programme.

Exemple

Une utilisation de cet élément est de permettre au logiciel de traiter des documents afin de générer en sortie un index et de l' insérer à l'endroit approprié. L'exemple ci-dessous suppose que l'attribut indexName sur les éléments index dans le texte a été employé pour spécifier des entrées d'index pour deux index produits, nommés NAMES and THINGS:

<back>
 <div1 type="backmat">
  <head>Bibliographie</head>
<!-- ... -->
 </div1>
 <div1 type="backmat">
  <head>Indices</head>
  <divGen n="Index Nominumtype="NAMES"/>
  <divGen n="Index Rerumtype="THINGS"/>
 </div1>
</back>
Exemple

Un autre usage de divGen est de spécifier l'emplacement d'une table des matières automatiquement produite.

<front>
 <divGen type="toc"/>
 <div>
  <head>Préface</head>
  <p> ... </p>
 </div>
</front>
Modèle de contenu
<content>
 <classRef key="model.headLike"
  minOccurs="0maxOccurs="unbounded"/>

</content>
Schéma Declaration
element divGen
{
   att.global.attributes,
   att.typed.attribute.subtype,
   attribute type { teidata.enumerated }?,
   model.headLike*
}

<docAuthor>

<docAuthor> (auteur du document) contient le nom de l’auteur du document tel qu’il est donné sur la page de titre (ce nom est le plus souvent contenu dans une mention de responsabilité) . [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Note

Le nom de l'auteur d'un document apparaît souvent au sein d'un élément byline, mais l'élément docAuthor peut être utilisé même si l'élément byline n'est pas présent.

Exemple
<titlePage>
 <docTitle>
  <titlePart>Le quart livre de faicts et dict Heroiques du bon
     Pantagruel</titlePart>
 </docTitle>
 <byline>Composé par <docAuthor>M. François Rabelais</docAuthor> docteur en Medicine.</byline>
</titlePage>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element docAuthor
{
   att.global.attributes,
   att.canonical.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<docDate>

<docDate> (date du document) contient la date d’un document telle qu’elle est (généralement ) donnée sur une page de titre. [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
Peut contenir
Note

Voir l'élément générique date dans le module core. L'élément spécifique docDate est fourni à toutes fins utiles pour encoder et traiter la date des documents, puisque celle-ci requiert une gestion particulière pour de nombreux besoins.

Exemple
<docImprint>Lettres Modernes Minard, <pubPlace>PARIS-CAEN</pubPlace>
 <docDate>2003</docDate>
</docImprint>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element docDate
{
   att.global.attributes,
   att.cmc.attributes,
   att.datable.attributes,
   att.calendarSystem.attributes,
   macro.phraseSeq
}

<docEdition>

<docEdition> (édition du document) contient une mention d’édition telle qu’elle figure sur la page de titre d’un document. [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
textstructure: back front titlePage
Peut contenir
Note

Voir l'élément edition dans une citation bibliographique. Comme d'habitude, un nom abrégé a été donné à l'élément le plus fréquent.

Exemple
<docEdition>3e Edition Augmentée</docEdition>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element docEdition { att.global.attributes, macro.paraContent }

<docImprint>

<docImprint> (mention d'impression) contient la mention d'impression de l'éditeur (lieu et date de publication, nom de l’éditeur), telle qu’elle est généralement donnée au bas de la page de titre. [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
textstructure: back front titlePage
Peut contenir
Note

Voir l'élément <imprint> dans une citation bibliographique. Comme pour le titre, l'auteur, et la mention d'édition, le nom le plus court est réservé à l'élément le plus fréquemment utilisé.

Exemple
<docImprint>2006, Les Editions Trintexte, Trinity College, Toronto, Canada M5S
1H8</docImprint>
Exemple

La description de l'impression est parfois plus complexe:

<docImprint>
 <pubPlace>PARIS</pubPlace>, <name>Delangle Frères</name> Éditeurs-libraires,
<pubPlace>Place de la Bourse</pubPlace>
</docImprint>
<docDate>MDCCCXXX</docDate>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <elementRef key="pubPlace"/>
  <elementRef key="docDate"/>
  <elementRef key="publisher"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element docImprint
{
   att.global.attributes,
   (
      text
    | model.gLikemodel.phrasepubPlacedocDatepublishermodel.global
   )*
}

<docTitle>

<docTitle> (titre du document) contient le titre d’un document, incluant la totalité de ses composants tels qu’ils sont donnés sur la page de titre. [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
textstructure: back front titlePage
Peut contenir
analysis: interp interpGrp
figures: figure
linking: anchor
textstructure: titlePart
Exemple
<docTitle>
 <titlePart type="main">LES CHOSES</titlePart>
 <titlePart type="sub">Une histoire des années soixante.</titlePart>
</docTitle>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <elementRef key="titlePart"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element docTitle
{
   att.global.attributes,
   att.canonical.attributes,
   ( model.global*, ( ( titlePart, model.global* )+ ) )
}

<edition>

<edition> (édition) décrit les particularités de l’édition d’un texte. [2.2.2. The Edition Statement]
Moduleheader
Attributs
Membre du
Contenu dans
core: bibl
header: editionStmt
Peut contenir
Exemple
<edition>Première édition électronique, Nancy <date>2002</date>
</edition>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element edition { att.global.attributes, macro.phraseSeq }

<editionStmt>

<editionStmt> (mention d'édition) regroupe les informations relatives à l’édition d’un texte. [2.2.2. The Edition Statement 2.2. The File Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
Exemple
<editionStmt>
 <edition>Deuxième édition</edition>
 <respStmt>
  <resp>réalisée par</resp>
  <name>L. F.</name>
 </respStmt>
</editionStmt>
Exemple
<editionStmt>
 <p>Première édition électronique, Nancy, <date> 2002</date>, réalisée dans le cadre de la
   base <ref target="http://www.frantext.fr/">FRANTEXT</ref> .</p>
</editionStmt>
Modèle de contenu
<content>
 <alternate>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

  <sequence>
   <elementRef key="edition"/>
   <classRef key="model.respLike"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </alternate>
</content>
Schéma Declaration
element editionStmt
{
   att.global.attributes,
   ( model.pLike+ | ( edition, model.respLike* ) )
}

<editor>

<editor> mention de responsabilité secondaire pour un item bibliographique, par exemple le nom d'une personne, d'une institution ou d'un organisme (ou de plusieurs d'entre eux) comme éditeur scientifique, compilateur, traducteur, etc. [3.12.2.2. Titles, Authors, and Editors]
Modulecore
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Note

Il est conseillé d'adopter un format cohérent.

Particulièrement lorsque le catalogage repose sur le contenu de l'en-tête TEI, il est conseillé d'utiliser des listes d'autorité reconnues pour trouver la forme exacte des noms de personnes.

Exemple
<editor> Pierre-Jules Hetzel</editor>
<editor role="illustrator">George Roux</editor>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element editor
{
   att.global.attributes,
   att.naming.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq
}

<editorialDecl>

<editorialDecl> (déclaration des pratiques éditoriales) donne des précisions sur les pratiques et les principes éditoriaux appliqués au cours de l’encodage du texte. [2.3.3. The Editorial Practices Declaration 2.3. The Encoding Description 16.3.2. Declarable Elements]
Moduleheader
Attributs
Membre du
Contenu dans
header: encodingDesc
Peut contenir
core: p
Exemple
<editorialDecl>
 <normalization>
  <p>Certains mots coupés par accident typographique en fin de ligne ont été réassemblés
     sans commentaire.</p>
 </normalization>
 <quotation marks="all">
  <p>Les "guillements français" ont été remplacée par des "guillemets droits" (sans
     symétrie)</p>
 </quotation>
</editorialDecl>
Modèle de contenu
<content>
 <alternate minOccurs="1"
  maxOccurs="unbounded">

  <classRef key="model.pLike"/>
  <classRef key="model.editorialDeclPart"/>
 </alternate>
</content>
Schéma Declaration
element editorialDecl
{
   att.global.attributes,
   att.declarable.attributes,
   ( model.pLike | model.editorialDeclPart )+
}

<eg>

<eg> (exemple) contient toutes sortes d'exemples illustratifs. [23.5. Element Specifications 23.5.3. Attribute List Specification]
Moduletagdocs
Attributs
Membre du
Contenu dans
Peut contenir
Note

Si le contenu de l'exemple est balisé en XML, il y a deux possibilités : soit ce contenu doit être mis dans une section littérale CDATA, soit des références d'entité de caractère doivent être utilisées pour représenter les délimiteurs de balisage. Si l'exemple contient du XML bien formé, il devrait être balisé en utilisant l'élément plus spécifique <egXML>.

Exemple
<p>L'élément <gi>term</gi> est déclaré en utilisant la syntaxe suivante :
<eg><![CDATA[<!ELEMENT term (%phrase.content;)>]]</eg>
</p>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element eg { att.global.attributes, macro.phraseSeq }

<emph>

<emph> (mis en valeur) marque des mots ou des expressions qui sont accentués ou mis en valeur pour un motif linguistique ou rhétorique. [3.3.2.2. Emphatic Words and Phrases 3.3.2. Emphasis, Foreign Words, and Unusual Language]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<div>
 <p>«Mes amis, dit-il, mes amis, je... je... »</p>
 <p>Mais quelque chose l'étouffait. Il ne pouvait pas achever sa phrase.</p>
 <p> Alors il se tourna vers le tableau, prit un morceau de craie, et, en appuyant de
   toutes ses forces, il écrivit aussi gros qu'il put : </p>
 <p>
  <emph>«vive la France !"»</emph>
 </p>
 <p> Puis il resta là, la tête appuyée au mur, et, sans parler, avec sa main il nous
   faisait signe:</p>
 <p>«C'est fini...allez-vous-en.»</p>
</div>
Exemple
<p> Tu sais quoi ? On l'aurait proposé pour <emph>la médaille</emph> ! </p>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element emph { att.global.attributes, att.cmc.attributes, macro.paraContent }

<encodingDesc>

<encodingDesc> (description de l'encodage) documente la relation d'un texte électronique avec sa ou ses sources. [2.3. The Encoding Description 2.1.1. The TEI Header and Its Components]
Moduleheader
Attributs
Membre du
Contenu dans
header: teiHeader
Peut contenir
Exemple
<encodingDesc>
 <projectDesc>
  <p>Corpus de
     textes sélectionnés pour la formation MISAT, Frejus,
     juillet 2010.
  </p>
 </projectDesc>
 <samplingDecl>
  <p>Corpus
     d'échantillons de 2000 mots pris au début de chaque texte. </p>
 </samplingDecl>
</encodingDesc>
Modèle de contenu
<content>
 <alternate minOccurs="1"
  maxOccurs="unbounded">

  <classRef key="model.encodingDescPart"/>
  <classRef key="model.pLike"/>
 </alternate>
</content>
Schéma Declaration
element encodingDesc
{
   att.global.attributes,
   ( model.encodingDescPart | model.pLike )+
}

<epigraph>

<epigraph> (epigraph) contient une citation, anonyme ou attribuée et qui apparaît au début d’une section ou d’un chapitre ou sur une page de titre. [4.2.3. Arguments, Epigraphs, and Postscripts 4.2. Elements Common to All Divisions 4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<epigraph xml:lang="la">
 <cit>
  <bibl>Lucret.</bibl>
  <quote>
   <l part="F">petere inde coronam,</l>
   <l>Vnde prius nulli velarint tempora Musae.</l>
  </quote>
 </cit>
</epigraph>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <classRef key="model.common"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element epigraph
{
   att.global.attributes,
   att.cmc.attributes,
   ( model.common | model.global )*
}

<expan>

<expan> (expansion) contient l'expansion d'une abréviation. [3.6.5. Abbreviations and Their Expansions]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

En général, le contenu de cet élément doit être une expression ou un mot complet. L'élément <ex> fourni par le module transcr peut être utilisé pour baliser des suites de lettres données dans une expansion de ce type.

Exemple
Il habite
<choice>
 <expan>Avenue</expan>
 <abbr>Av.</abbr>
</choice>de la Paix
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element expan
{
   att.global.attributes,
   att.editLike.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<extent>

<extent> (étendue) décrit la taille approximative d’un texte stocké sur son support, numérique ou non numérique, exprimé dans une unité quelconque appropriée. [2.2.3. Type and Extent of File 2.2. The File Description 3.12.2.4. Imprint, Size of a Document, and Reprint Information 11.7.1. Object Description]
Moduleheader
Attributs
Membre du
Contenu dans
core: bibl
header: fileDesc
Peut contenir
Exemple
<extent>198 pages</extent>
<extent>90 195 mots</extent>
<extent>1 Mo</extent>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element extent { att.global.attributes, macro.phraseSeq }

<figDesc>

<figDesc> (description d'une figure) contient une brève description de l'apparence ou du contenu d'une représentation graphique, pour documenter une image sans avoir à l'afficher [15.4. Specific Elements for Graphic Images]
Modulefigures
Attributs
Contenu dans
figures: figure
Peut contenir
Note

Cet élément est prévu pour être utilisé comme alternative au contenu de son élément parent figure; par exemple, pour montrer que l'image est exigée mais que le matériel en service ne peut pas montrer des documents graphiques. Il peut également être employé pour l'indexation ou dans un but documentaire.

Exemple
<figure>
 <graphic url="chap3fig2.png"/>
 <head>Dick Kennedy </head>
 <figDesc>Gravure de E. Riou représentant un jeune homme assis sur une chaise, les
   pieds sur une autre et tenant à la main une canne. En arrière plan, une théière, et
   l'inscription <q>Map of Africa</q> .</figDesc>
</figure>
Modèle de contenu
<content>
 <macroRef key="macro.limitedContent"/>
</content>
Schéma Declaration
element figDesc { att.global.attributes, macro.limitedContent }

<figure>

<figure> (figure) regroupe des éléments représentant ou contenant une information graphique comme une illustration ou une figure. [15.4. Specific Elements for Graphic Images]
Modulefigures
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<figure>
 <head>La tour rouge, de Giorgio De Chirico</head>
 <figDesc>Le tableau représente un donjon au pied duquel s'étend un espace quasiment vide,
   hormis quelques détails</figDesc>
 <graphic url="http://www.cineclubdecaen.com/cinepho/peint/dechericho/tourrouge.jpg"
  scale="0.5"/>

</figure>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <classRef key="model.headLike"/>
  <classRef key="model.common"/>
  <elementRef key="figDesc"/>
  <classRef key="model.graphicLike"/>
  <classRef key="model.global"/>
  <classRef key="model.divBottom"/>
 </alternate>
</content>
Schéma Declaration
element figure
{
   att.global.attributes,
   att.placement.attributes,
   att.typed.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      model.headLikemodel.commonfigDescmodel.graphicLikemodel.globalmodel.divBottom
   )*
}

<fileDesc>

<fileDesc> (description bibliographique du fichier) contient une description bibliographique complète du fichier électronique. [2.2. The File Description 2.1.1. The TEI Header and Its Components]
Moduleheader
Attributs
Contenu dans
header: teiHeader
Peut contenir
Note

Cet élément est la source d'information principale pour créer une notice de catalogage ou une référence bibliographique destinée à un fichier électronique. Il fournit le titre et les mentions de responsabilité, ainsi que des informations sur la publication ou la distribution du fichier, sur la collection à laquelle il appartient le cas échéant, ainsi que des notes détaillées sur des informations qui n'apparaissent pas ailleurs dans l'en-tête. Il contient également une description bibliographique complète de la ou des sources du texte produit.

Exemple
<teiHeader>
 <fileDesc>
  <titleStmt>
   <title>Le document TEI minimal</title>
  </titleStmt>
  <publicationStmt>
   <p>Distribué comme partie de TEI P5</p>
  </publicationStmt>
  <sourceDesc>
   <p>Aucune source : ce document est né numérique</p>
  </sourceDesc>
 </fileDesc>
</teiHeader>
Modèle de contenu
<content>
 <sequence>
  <sequence>
   <elementRef key="titleStmt"/>
   <elementRef key="editionStmt"
    minOccurs="0"/>

   <elementRef key="extentminOccurs="0"/>
   <elementRef key="publicationStmt"/>
   <elementRef key="seriesStmt"
    minOccurs="0maxOccurs="unbounded"/>

   <elementRef key="notesStmt"
    minOccurs="0"/>

  </sequence>
  <elementRef key="sourceDesc"
   minOccurs="1maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element fileDesc
{
   att.global.attributes,
   (
      (
         titleStmt,
         editionStmt?,
         extent?,
         publicationStmt,
         seriesStmt*,
         notesStmt?
      ),
      sourceDesc+
   )
}

<foreign>

<foreign> (étranger) reconnaît un mot ou une expression comme appartenant à une langue différente de celle du contexte. [3.3.2.1. Foreign Words or Expressions]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

L'attribut global xml:lang doit être fourni dans cet élément pour identifier la langue à laquelle appartiennent le mot ou l'expression balisée. Comme ailleurs, sa valeur devrait être une balise de langue définie dans 6.1. Language Identification.

Cet élément n'est utilisé que lorsqu'il n'y a pas d'autre élément disponible pour baliser l'expression ou les mots concernés. L'attribut global xml:lang doit être préféré à cet élément lorsqu'il s'agit de caractériser la langue de l'ensemble d'un élément textuel.

L'élément <distinct> peut être utilisé pour identifier des expressions appartenant à des variétés de langue ou à des registres qui ne sont pas généralement considérés comme de vraies langues.

Exemple
<foreign xml:lang="la">Et vobis</foreign> messieurs,
Ce ne seroyt que bon que nous rendissiez noz cloches...
Exemple
<p>Pendant ce temps-là, dans le bureau du rez- de-chaussée, les secrétaires faisaient du
<foreign xml:lang="en">hulla-hoop</foreign>.</p>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element foreign { att.global.attributes, att.cmc.attributes, macro.phraseSeq }

<formula>

<formula> (formule) contient une formule mathématique ou tout autre type de formule [15.2. Formulæ and Mathematical Expressions]
Modulefigures
Attributs
Membre du
Contenu dans
Peut contenir
core: graphic hi q
figures: formula
des données textuelles
Exemple
<formula notation="tex">$E=mc^2$</formula>
Exemple
<formula notation="none">E=mc<hi rend="sup">2</hi>
</formula>
Exemple
<formula notation="mathml">
 <m:math>
  <m:mi>E</m:mi>
  <m:mo>=</m:mo>
  <m:mi>m</m:mi>
  <m:msup>
   <m:mrow>
    <m:mi>c</m:mi>
   </m:mrow>
   <m:mrow>
    <m:mn>2</m:mn>
   </m:mrow>
  </m:msup>
 </m:math>
</formula>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.graphicLike"/>
  <classRef key="model.hiLike"/>
 </alternate>
</content>
Schéma Declaration
element formula
{
   att.global.attributes,
   att.notated.attributes,
   att.cmc.attributes,
   ( text | model.graphicLike | model.hiLike )*
}

<front>

<front> (texte préliminaire) contient tout ce qui est au début du document, avant le corps du texte : page de titre, dédicaces, préfaces, etc. [4.6. Title Pages 4. Default Text Structure]
Moduletextstructure
Attributs
Contenu dans
textstructure: text
Peut contenir
Note

Because cultural conventions differ as to which elements are grouped as front matter and which as back matter, the content models for the front and back elements are identical.

Exemple
<front>
 <epigraph>
  <quote>Nam Sibyllam quidem Cumis ego ipse oculis meis vidi in ampulla
     pendere, et cum illi pueri dicerent: <q xml:lang="grc">Σίβυλλα τί
       θέλεις</q>; respondebat illa: <q xml:lang="grc">ὰποθανεῖν θέλω.</q>
  </quote>
 </epigraph>
 <div type="dedication">
  <p>For Ezra Pound <q xml:lang="it">il miglior fabbro.</q>
  </p>
 </div>
</front>
Exemple
<front>
 <div type="dedication">
  <p>à la mémoire de Raymond Queneau</p>
 </div>
 <div type="avertissement">
  <p>L'amitié, l'histoire et la littérature m'ont fourni quelques-uns
     des.personnages de ce livre. Toute autre ressemblance avec des
     individus vivants ou ayant réellement ou fictivement existé ne
     saurait être que coïncidence.</p>
  <epigraph>
   <quote>Regarde de tous tes yeux, regarde <bibl>(Jules Verne, Michel
         Strogoff )</bibl>
   </quote>
  </epigraph>
 </div>
 <div type="preambule">
  <head>PRÉAMBULE</head>
  <epigraph>
   <quote>
    <q>L'œil suit les chemins qui lui ont été ménagés dans l'oeuvre
    <bibl>(Paul Klee, Pädagosisches Skizzenbuch)</bibl>
    </q>
   </quote>
  </epigraph>
  <p> Au départ, l'art du puzzle semble un art bref, un art mince, tout
     entier contenu dans un maigre enseignement de la Gestalttheorie :
     ...</p>
 </div>
</front>
Exemple
<front>
 <div type="preface">
  <head>Préface</head>
  <p>Tant qu'il existera, par le fait des lois et des moeurs, une
     damnation sociale créant artificiellement, en pleine civilisation,
     des enfers, et compliquant d'une fatalité humaine la destinée qui
     est divine ; tant que les trois problèmes du siècle, la dégradation
     de l'homme par le prolétariat, la déchéance de la femme par la faim,
     l'atrophie de l'enfant par la nuit, ne seront pas résolus; tant que,
     dans certaines régions, l'asphyxie sociale sera possible; en
     d'autres termes, et à un point de vue plus étendu encore, tant qu'il
     aura sur la terre ignorance et misère, des livres de la nature de
     celui-ci pourront ne pas être inutiles.</p>
  <closer>
   <dateline>
    <name type="place">Hauteville-House</name>
    <date>1er janvier 1862</date>
   </dateline>
  </closer>
 </div>
</front>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.frontPart"/>
   <classRef key="model.pLike"/>
   <classRef key="model.pLike.front"/>
   <classRef key="model.global"/>
  </alternate>
  <sequence minOccurs="0">
   <alternate>
    <sequence>
     <classRef key="model.div1Like"/>
     <alternate minOccurs="0"
      maxOccurs="unbounded">

      <classRef key="model.div1Like"/>
      <classRef key="model.frontPart"/>
      <classRef key="model.global"/>
     </alternate>
    </sequence>
    <sequence>
     <classRef key="model.divLike"/>
     <alternate minOccurs="0"
      maxOccurs="unbounded">

      <classRef key="model.divLike"/>
      <classRef key="model.frontPart"/>
      <classRef key="model.global"/>
     </alternate>
    </sequence>
   </alternate>
   <sequence minOccurs="0">
    <classRef key="model.divBottom"/>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <classRef key="model.divBottom"/>
     <classRef key="model.global"/>
    </alternate>
   </sequence>
  </sequence>
 </sequence>
</content>
Schéma Declaration
element front
{
   att.global.attributes,
   att.declaring.attributes,
   (
      ( model.frontPart | model.pLike | model.pLike.front | model.global )*,
      (
         (
            (
               (
                  model.div1Like,
                  ( model.div1Like | model.frontPart | model.global )*
               )
             | (
                  model.divLike,
                  ( model.divLike | model.frontPart | model.global )*
               )
            ),
            ( ( model.divBottom, ( model.divBottom | model.global )* )? )
         )?
      )
   )
}

<funder>

<funder> (financeur) désigne le nom d’une personne ou d’un organisme responsable du financement d’un projet ou d’un texte. [2.2.1. The Title Statement]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Note

Les financeurs apportent un soutien financier au projet ; ils se distinguent des commanditaires, qui apportent une caution , une autorité intellectuelle.

Exemple
<funder>Ministère de l'Enseignement supérieur et de la Recherche</funder>
<funder>Conseil général de Meurthe-et-Moselle </funder>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element funder
{
   att.global.attributes,
   att.canonical.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq.limited
}

<gap>

<gap> (omission) indique une omission dans une transcription, soit pour des raisons éditoriales décrites dans l'en-tête TEI au cours d’un échantillonnage, soit parce que le matériau est illisible ou inaudible. [3.5.3. Additions, Deletions, and Omissions]
Modulecore
Attributs
reason(reason) donne la raison de l'omission
Statut Optionel
Type de données 1–∞ occurrences de teidata.enumerated séparé par un espace
Les valeurs suggérées comprennent:
cancelled
(biffé)
deleted
(deleted)
editorial
(editorial) for features omitted from transcription due to editorial policy
illegible
(illisible)
inaudible
(inaudible)
irrelevant
(non pertinent)
sampling
(échantillonnage)
agent(agent) lorsque du texte est omis de la transcription en raison d'un dommage, catégorise la cause du dommage, si celle-ci peut être identifiée.
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
rubbing
(rubbing) dégâts provoqués par le frottement des bords de la feuille.
mildew
(mildew) dégâts provoqués par de la moisissure sur la surface de feuille.
smoke
(smoke) dégâts provoqués par de la fumée.
Membre du
Contenu dans
Peut contenir
core: desc
Note

Les éléments du jeu de balises de base gap, unclear, et del peuvent être étroitement associés avec l'utilisation des éléments <damage> et <supplied> qui sont disponibles si l'on utilise le jeu de balises additionnel pour la transcription des sources primaires. Voir la section 12.3.3.2. Use of the gap, del, damage, unclear, and supplied Elements in Combination pour plus de détails sur l'élément le plus pertinent suivant les circonstances.

Exemple
<gap quantity="4unit="chars"
 reason="illegible"/>
Exemple
<gap quantity="1unit="essay"
 reason="sampling"/>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <classRef key="model.descLike"/>
  <classRef key="model.certLike"/>
 </alternate>
</content>
Schéma Declaration
element gap
{
   att.global.attributes,
   att.timed.attributes,
   att.editLike.attributes,
   att.dimensions.attributes,
   att.cmc.attributes,
   attribute reason
   {
      list
      {
         (
            "cancelled"
          | "deleted"
          | "editorial"
          | "illegible"
          | "inaudible"
          | "irrelevant"
          | "sampling"
          | teidata.enumerated
         )+
      }
   }?,
   attribute agent { teidata.enumerated }?,
   ( model.descLike | model.certLike )*
}

<gi>

<gi> (identifiant générique) contient le nom d'un élément. [23. Documentation Elements 23.5. Element Specifications]
Moduletagdocs
Attributs
schemefournit le nom du modèle dans lequel ce nom est défini
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
TEI
cet élément fait partie du modèle TEI. [Valeur par défaut]
DBK
(docbook) cet élément fait partie du modèle Docbook.
XX
( inconnu.) cet élément fait partie d'un modèle inconnu.
Schematron
cet élément est défini dans le schéma Schematron.
HTML
cet élément est défini dans le schéma HTML.
Membre du
Contenu dans
Peut contenir
XSD Name
Exemple
<p>L'élément <gi>xhtml:li</gi> est grosso modo analogue à l'élément <gi>item</gi>, comme
l'est l'élément <gi scheme="DBK">listItem</gi>.</p>

Cet exemple montre que l'emploi d'un espace de noms préfixe et celui de l'attribut de schéma sont des alternatives possibles pour indiquer que le gi en question n'est pas un nom d'élément TEI : dans la pratique, une seule méthode sera utilisée.

Modèle de contenu
<content>
 <dataRef key="teidata.name"/>
</content>
Schéma Declaration
element gi
{
   att.global.attributes,
   attribute scheme { teidata.enumerated }?,
   teidata.name
}

<gloss>

<gloss> (glose) identifie une expression ou un mot utilisé pour fournir une glose ou une définition à quelque autre mot ou expression. [3.4.1. Terms and Glosses 23.4.1. Description of Components]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Les attributs target et cRef sont exclusifs l'un de l'autre.

Exemple
Les<term> embrayeurs</term> sont
<gloss>une classe de mots dont le sens varie avec la situation; ces
mots, n'ayant pas de référence propre dans la langue, ne reçoivent un référent que
lorsqu'ils sont inclus dans un message.</gloss>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element gloss
{
   att.global.attributes,
   att.declaring.attributes,
   att.translatable.attributes,
   att.typed.attributes,
   att.pointing.attributes,
   att.cReferencing.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<graphic>

<graphic> (graphic) indique l'emplacement d'une image, d'une illustration ou d'un schéma intégrés. [3.10. Graphics and Other Non-textual Components 12.1. Digital Facsimiles]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
core: desc
Note

L'attribut mimeType doit être utilisé pour spécifier le type MIME de l'image référencée par l'attribut url.

Exemple
<figure>
 <graphic url="fig1.png"/>
 <head>Figure Une : Jan van Eyck, La Vierge du chancelier Rolin</head>
 <p>Si, attiré par la curiosité, on a l'imprudence de l'approcher d'un peu trop prés, c'est fini, on est pris pour tout le temps que peut durer l'effort d'une attention soutenue ; on s'extasie devant la finesse du détail ... il va toujours plus loin, franchit une à une les croupes des collines verdoyantes ; se repose un moment sur une ligne lointaine de montagnes neigeuses; pour se perdre ensuite dans l'infini d'un ciel à peine bleu, où s'estompent de flottantes nuées. </p>
</figure>
Modèle de contenu
<content>
 <classRef key="model.descLike"
  minOccurs="0maxOccurs="unbounded"/>

</content>
Schéma Declaration
element graphic
{
   att.global.attributes,
   att.media.attributes,
   att.resourced.attributes,
   att.declaring.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   model.descLike*
}

<group>

<group> (groupe) contient un ensemble de textes distincts (ou des groupes de textes de ce type), considérés comme formant une unité, par exemple pour présenter les œuvres complètes d’un auteur, une suite d’essais en prose, etc. [4. Default Text Structure 4.3.1. Grouped Texts 16.1. Varieties of Composite Text]
Moduletextstructure
Attributs
Contenu dans
textstructure: group text
Peut contenir
Exemple
<TEI xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!--[ en-tête du texte composite ]-->
 </teiHeader>
 <text>
  <front>
<!--[ partie préliminaire du texte composite ]-->
  </front>
  <group>
   <text>
    <front>
<!--[ partie préliminaire du premier texte ]-->
    </front>
    <body>
<!--[ corps du premier texte ]-->
    </body>
    <back>
<!--[ annexe du premier texte ]-->
    </back>
   </text>
   <text>
    <front>
<!--[ partie préliminaire du deuxième texte ]-->
    </front>
    <body>
<!--[ corps du deuxième texte ]-->
    </body>
    <back>
<!--[ annexe du deuxième texte ]-->
    </back>
   </text>
<!--[ encore de textes, simples ou composites ]-->
  </group>
  <back>
<!--[ annexe du texte composite ]-->
  </back>
 </text>
</TEI>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divTop"/>
   <classRef key="model.global"/>
  </alternate>
  <sequence>
   <alternate>
    <elementRef key="text"/>
    <elementRef key="group"/>
   </alternate>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <elementRef key="text"/>
    <elementRef key="group"/>
    <classRef key="model.global"/>
   </alternate>
  </sequence>
  <classRef key="model.divBottom"
   minOccurs="0maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element group
{
   att.global.attributes,
   att.declaring.attributes,
   att.typed.attributes,
   (
      ( model.divTop | model.global )*,
      ( ( text | group ), ( text | group | model.global )* ),
      model.divBottom*
   )
}
<head> (en-tête) contient tout type d'en-tête, par exemple le titre d'une section, ou l'intitulé d'une liste, d'un glossaire, d'une description de manuscrit, etc. [4.2.1. Headings and Trailers]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

L'élément head est utilisé pour les titres de tous niveaux ; un logiciel qui traitera différemment, par exemple, les titres de chapitres, les titres de sections et les titres de listes, devra déterminer le traitement approprié de l'élément head rencontré en fonction de sa position dans la structure XML. Un élément head qui est le premier élément d'une liste est le titre de cette liste ; si l'élément head apparaît comme le premier élément d'un élément <div1>, il sera considéré comme le titre de ce chapitre ou de cette section.

Exemple

L'élémentheadest employé habituellement pour marquer les titres de sections. Dans d'anciens textes , les titres des textes conclusifs seront précédés de l'élément trailer, comme dans cet exemple :

<div type="chapitre">
 <head>Les Mille et une Nuits</head>
 <p>LES chroniques des Sassaniens, anciens rois de Perse, qui avaient étendu leur empire
   dans les Indes, [...]</p>
 <div type="histoire">
  <head>Histoire du Vizir puni</head>
  <p>IL était autrefois un roi, poursuivit-il, qui avait un<lb/> fils qui aimait
     passionnément la chasse. Il lui permettait<lb/> de prendre souvent ce divertissement ;
     [...] </p>
 </div>
</div>
<trailer>
 <hi rend="majuscule">fin du tome premier.</hi>
</trailer>
Exemple

L'élément head est aussi employé pour donner un titre à d'autres éléments, dans une liste par exemple :

Les déictiques
sont des termes qui ne prennent leur sens que dans le cadre de la situation d'énonciation.
<list rend="bulleted">
 <head>déictiques</head>
 <item>ici</item>
 <item>hier</item>
 <item></item>
 <item>je</item>
 <item>tu</item>
 <item>nous</item>
 <item>vous</item>
 <item/>
</list>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <elementRef key="lg"/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.inter"/>
  <classRef key="model.lLike"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element head
{
   att.global.attributes,
   att.typed.attributes,
   att.placement.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      text
    | lgmodel.gLikemodel.phrasemodel.intermodel.lLikemodel.global
   )*
}

<hi>

<hi> (mis en évidence) distingue un mot ou une expression comme graphiquement distincte du texte environnant, sans en donner la raison. [3.3.2.2. Emphatic Words and Phrases 3.3.2. Emphasis, Foreign Words, and Unusual Language]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<p>Au fronton, on lit cette inscription : <hi rend="uppercase">attends. Tu verras.</hi> Le
notaire encore prétend qu' elle ne saurait être antérieure au XVIII siècle, car, sinon, l'
on eût écrit --<q>tu voiras</q>--. </p>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element hi
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<ident>

<ident> (identifiant) contient un identifiant ou un nom dans un langage formel pour un objet quelconque. [23.1.1. Phrase Level Terms]
Moduletagdocs
Attributs
Membre du
Contenu dans
Peut contenirDes données textuelles uniquement
Note

Dans un texte courant, cet élément peut être utilisé pour n'importe quelle sorte d'identifiant dans tout langage formel.

Exemple
<ident type="ns">http://www.tei-c.org/ns/Examples</ident>
Exemple
<ident type="ns">http://www.tei-c.org/ns/Examples</ident>
Modèle de contenu
<content>
 <textNode/>
</content>
Schéma Declaration
element ident { att.global.attributes, att.typed.attributes, text }

<idno>

<idno> (identifiant) donne un identifiant standardisé qui peut être utilisé pour identifier une référence bibliographique, une personne, un titre d'ouvrage ou une organisation. [14.3.1. Basic Principles 2.2.4. Publication, Distribution, Licensing, etc. 2.2.5. The Series Statement 3.12.2.4. Imprint, Size of a Document, and Reprint Information]
Moduleheader
Attributs
typeclasse un numéro dans une catégorie, par exemple comme étant un numéro ISBN ou comme appartenant une autre série normalisée.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
header: idno
des données textuelles
Note

idno should be used for labels which identify an object or concept in a formal cataloguing system such as a database or an RDF store, or in a distributed system such as the World Wide Web. Some suggested values for type on idno are ISBN, ISSN, DOI, and URI.

Exemple
<idno type="ISBN">978-1-906964-22-1</idno>
<idno type="ISSN">0143-3385</idno>
<idno type="DOI">10.1000/123</idno>
<idno type="URI">http://www.worldcat.org/oclc/185922478</idno>
<idno type="URI">http://authority.nzetc.org/463/</idno>
<idno type="LT">Thomason Tract E.537(17)</idno>
<idno type="Wing">C695</idno>
<idno type="oldCat">
 <g ref="#sym"/>345
</idno>

In the last case, the identifier includes a non-Unicode character which is defined elsewhere by means of a <glyph> or <char> element referenced here as #sym.

Exemple
<idno type="ISSN">0143-3385</idno>
<idno type="OTA">116</idno>
<idno type="ISBN">1-896016-00-6</idno>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <elementRef key="idno"/>
 </alternate>
</content>
Schéma Declaration
element idno
{
   att.global.attributes,
   att.sortable.attributes,
   att.datable.attributes,
   att.typed.attribute.subtype,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   attribute calendar { list { teidata.pointer+ } }?,
   ( text | model.gLike | idno )*
}

<imprimatur>

<imprimatur> (imprimatur) contient une mention formalisée autorisant la publication d’un ouvrage, parfois exigée sur une page de titre ou à son verso. [4.6. Title Pages]
Moduletextstructure
Attributs
Membre du
Contenu dans
textstructure: titlePage
Peut contenir
Exemple
<imprimatur>Paris, 20 juin 1968; E. Berrat, Vicaire général.</imprimatur>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element imprimatur { att.global.attributes, macro.paraContent }

<index>

<index> (entrée d'index) marque un emplacement à indexer dans un but quelconque. [3.9.2. Index Entries]
Modulecore
Attributs
indexNamedonne un nom pour préciser à quel index (parmi plusieurs) appartient l'entrée d'index.
Statut Optionel
Type de données teidata.name
Note

Cet attribut permet de créer plusieurs index pour un texte donné.

Membre du
Contenu dans
Peut contenir
core: index term
Exemple
Ils [les
onagres] me venaient de mon grand-père maternel, l'empereur Saharil, fils d'Iakhschab, fils d'Iaarab, fils de Kastan <index indexName="NAMES">
 <term>Saharil</term>
</index>
<index indexName="NAMES">
 <term>Iaarab</term>
</index>
<index indexName="NAMES">
 <term>Kastan</term>
</index>
Modèle de contenu
<content>
 <sequence minOccurs="0"
  maxOccurs="unbounded">

  <elementRef key="term"/>
  <elementRef key="indexminOccurs="0"/>
 </sequence>
</content>
Schéma Declaration
element index
{
   att.global.attributes,
   att.spanning.attributes,
   att.cmc.attributes,
   attribute indexName { teidata.name }?,
   ( ( term, index? )* )
}

<interp>

<interp> (interprétation) interprétation sous la forme d'une annotation concise, pouvant être liée à un passage dans un texte [18.3. Spans and Interpretations]
Moduleanalysis
Attributs
Membre du
Contenu dans
Peut contenir
core: desc
des données textuelles
Note

Generally, each interp element carries an xml:id attribute. This permits the encoder to explicitly associate the interpretation represented by the content of an interp with any textual element through its ana attribute.

Alternatively (or, in addition) an interp may carry an inst attribute that points to one or more textual elements to which the analysis represented by the content of the interp applies.

Exemple
<interp type="structuralunit">conséquence</interp>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.descLike"/>
  <classRef key="model.certLike"/>
 </alternate>
</content>
Schéma Declaration
element interp
{
   att.global.attributes,
   att.interpLike.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.descLike | model.certLike )*
}

<interpGrp>

<interpGrp> (groupe d'interprétations) regroupe un ensemble d'interprétations ayant en commun une mention de responsabilité ou un type [18.3. Spans and Interpretations]
Moduleanalysis
Attributs
Membre du
Contenu dans
Peut contenir
analysis: interp
core: desc
Note

Un nombre quelconque d'éléments interp.

Exemple
<interpGrp resp="#fr_TMA"
 type="structuralunit">

 <desc>Organisation structurelle de base</desc>
 <interp xml:id="fr_I1">introduction</interp>
 <interp xml:id="fr_I2">conflit</interp>
 <interp xml:id="fr_I3">apogée</interp>
 <interp xml:id="fr_I4">vengeance</interp>
 <interp xml:id="fr_I5">reconciliation</interp>
 <interp xml:id="fr_I6">conséquence</interp>
</interpGrp>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.descLike"
   minOccurs="0maxOccurs="unbounded"/>

  <elementRef key="interpminOccurs="1"
   maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element interpGrp
{
   att.global.attributes,
   att.interpLike.attributes,
   att.cmc.attributes,
   ( model.descLike*, interp+ )
}

<item>

<item> (item) contient un composant d'une liste. [3.8. Lists 2.6. The Revision Description]
Modulecore
Attributs
Contenu dans
core: list
Peut contenir
Note

Peut contenir un texte ou une succession d'extraits.

Toute chaîne de caractères utilisée pour étiqueter un item de liste dans le texte peut être utilisée comme valeur de l'attribut global n, mais il n'est pas obligatoire de noter explicitement cette numérotation. Dans les listes ordonnées, l'attribut n de l'élément item est par définition synonyme de l'utilisation de l'élément label pour noter le numéro de l'item de la liste. Pour les glossaires toutefois, le terme défini doit être donné avec l'élément label, et non pas n.

Exemple
<list type="unordered">
 <head>Tentative d'inventaire de quelques-unes des choses qui ont été trouvées dans
   les escaliers au fil des ans.</head>
 <item>Plusieurs photos, dont celle d'une jeune fille de quinze<lb/> ans vêtue d'un slip
   de bain noir et d'un chandail blanc, agenouillée sur une plage,</item>
 <item>un réveil radio de toute évidence destiné à un réparateur, dans un sac plastique
   des établissements Nicolas,</item>
 <item>un soulier noir orné de brillants,</item>
 <item>une mule en chevreau doré,</item>
 <item>une boîte de pastilles Géraudel contre la toux.</item>
</list>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element item
{
   att.global.attributes,
   att.sortable.attributes,
   macro.specialPara
}

<keywords>

<keywords> (mot clé) contient une liste de mots clés ou d’expressions décrivant la nature ou le sujet d’un texte. [2.4.3. The Text Classification]
Moduleheader
Attributs
schemedésigne la liste close de mots dans lequel l'ensemble des mots-clés concernés est défini.
Statut Optionel
Type de données teidata.pointer
Contenu dans
header: textClass
Peut contenir
core: list term
Note

Each individual keyword (including compound subject headings) should be supplied as a term element directly within the keywords element. An alternative usage, in which each term appears within an item inside a list is permitted for backwards compatibility, but is deprecated.

If no control list exists for the keywords used, then no value should be supplied for the scheme attribute.

Exemple
<keywords scheme="#fr_RAMEAU">
 <term>Littérature française -- 20ème siècle -- Histoire et critique</term>
 <term>Littérature française -- Histoire et critique -- Théorie, etc.</term>
 <term>Français (langue) -- Style -- Bases de données.</term>
</keywords>
Modèle de contenu
<content>
 <alternate>
  <elementRef key="termminOccurs="1"
   maxOccurs="unbounded"/>

  <elementRef key="list"/>
 </alternate>
</content>
Schéma Declaration
element keywords
{
   att.global.attributes,
   attribute scheme { teidata.pointer }?,
   ( term+ | list )
}

<l>

<l> (vers) contient un seul vers, éventuellement incomplet. [3.13.1. Core Tags for Verse 3.13. Passages of Verse or Drama 7.2.5. Speech Contents]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<l met="x/x/x/x/x/real="/xx/x/x/x/">Shall I compare thee to a summer's day?</l>
Exemple
<l>Que toujours, dans vos vers, le sens coupant les mots</l>
<l>Suspende l'hémistiche, en marque le repos.</l>
Schematron

<sch:rule context="tei:l">
<sch:report test="ancestor::tei:l[not(.//tei:note//tei:l[. = current()])]">Abstract model violation: Lines may not contain lines or lg elements.</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.inter"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element l
{
   att.global.attributes,
   att.fragmentable.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.phrase | model.inter | model.global )*
}

<label>

<label> (étiquette) contient l'étiquette attachée à un item dans une liste ; dans les glossaires, il marque le terme qui est défini. [3.8. Lists]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple

label est souvent employé pour identifier les mots dans des listes de glossaire ; on note l'utilisation de l’attribut global xml:lang : l'ancien français est la langue par défaut du glossaire

<list type="glossxml:lang="fro">
 <head xml:lang="en">Vocabulaire</head>
 <headLabel xml:lang="fr">Ancien français</headLabel>
 <headItem xml:lang="fr">Français moderne</headItem>
 <label>amerté</label>
 <item xml:lang="fr">amertume</item>
 <label>barquer</label>
 <item xml:lang="fr">conduire une barque</item>
 <label>biberon</label>
 <item xml:lang="fr">goulot d'un vase.</item>
 <label>bugle</label>
 <item xml:lang="fr">jeune boeuf</item>
 <label>cestui</label>
 <item xml:lang="fr">celui-ci</item>
 <label>chaitiveté</label>
 <item xml:lang="fr">captivité</item>
 <label>duire</label>
 <item xml:lang="fr">conduire</item>
 <label>dangier</label>
 <item xml:lang="fr">puissance, pouvoir</item>
 <label>sangler</label>
 <item xml:lang="la">singularis</item>
 <label>vespre </label>
 <item xml:lang="fr">tombée du jour (cf. <cit>
   <ref>Lexique de Godefroy</ref>
   <quote>de hautes vespres : tard dans la soirée.</quote>
  </cit>)</item>
</list>
Exemple

On emploie aussi label pour enregistrer le classement alphanumérique d'items dans des listes ordonnées.

L’unité mixte de
recherche ATILF (Analyse et Traitement Informatique de la Langue Française) propose 3 types
de ressources : <list rend="runontype="ordered">
 <label>(1)</label>
 <item>Des ressources linguistiques publiées.</item>
 <label>(2) </label>
 <item>Des ressources linguistiques informatisées.</item>
 <label>(3) </label>
 <item>Des ressources linguistiques logicielles.</item>
</list>
Exemple

On emploie aussi label dans d'autres listes structurées, comme dans cet extrait du journal de Jules Renard.

<list type="gloss">
 <label>1er janvier..</label>
 <item> L'esprit inquiet mais clairvoyant, c'est-à-dire actif et sain, de l'homme qui ne
   travaille pas.</item>
 <label>7 janvier. </label>
 <item>On parle de Syveton. Elle aussi se rappelle avoir été, petite fille, poursuivie par
   un homme tout décolleté du bas et qu'on appelait l'homme au nez rouge. </item>
 <label>9 janvier. </label>
 <item>Jaurès dit que Syveton n'avait aucun intérêt à se tuer mais, à y regarder de près,
   oui, en cherchant bien, on trouve que nous avons tous un intérêt quelconque à nous tuer. </item>
 <label>13 janvier. </label>
 <item>Dans mon coeur froid, quelques rares jolis sentiments, comme des oiseaux aux petites
   pattes sur de la neige.</item>
</list>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element label
{
   att.global.attributes,
   att.typed.attributes,
   att.placement.attributes,
   att.written.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<language>

<language> (langue) caractérise une langue ou une variété de langue utilisée dans un texte. [2.4.2. Language Usage]
Moduleheader
Attributs
ident(identificateur) fournit un code de langue issu de la recommandation BCP 47 (ou son successeur) utilisé pour identifier la langue précisée par cet élément, référencé par l’attribut global xml:lang s’appliquant à l’élément considéré.
Statut Requis
Type de données teidata.language
usageprécise approximativement le pourcentage du volume de texte utilisant cette langue.
Statut Optionel
Type de données nonNegativeInteger
Contenu dans
header: langUsage
Peut contenir
Note

Dans le cas particulier des variétés de langues, l'élément contiendra un texte caractérisant mais non structuré.

Exemple
<langUsage>
 <language ident="en-USusage="75">Anglais américain moderne</language>
 <language ident="az-Arabusage="20">Azerbaijanais en caractères arabes</language>
 <language ident="x-verlanusage="05">verlan</language>
</langUsage>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element language
{
   att.global.attributes,
   attribute ident { teidata.language },
   attribute usage { xsd:nonNegativeInteger }?,
   macro.phraseSeq.limited
}

<langUsage>

<langUsage> (langue utilisée) décrit les langues, variétés de langues, registres, dialectes, etc. présents à l’intérieur d’un texte. [2.4.2. Language Usage 2.4. The Profile Description 16.3.2. Declarable Elements]
Moduleheader
Attributs
Membre du
Contenu dans
header: profileDesc
Peut contenir
core: p
header: language
Exemple
<langUsage>
 <language ident="fr-CAusage="60">Québecois</language>
 <language ident="en-CAusage="20">Anglais canadien des affaires</language>
 <language ident="en-GBusage="20">Anglais de Grande-Bretagne</language>
</langUsage>
Modèle de contenu
<content>
 <alternate>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

  <elementRef key="languageminOccurs="1"
   maxOccurs="unbounded"/>

 </alternate>
</content>
Schéma Declaration
element langUsage
{
   att.global.attributes,
   att.declarable.attributes,
   ( model.pLike+ | language+ )
}

<lb>

<lb> (début de ligne) marque le début d'une nouvelle ligne (typographique) dans une édition ou dans une version d'un texte. [3.11.3. Milestone Elements 7.2.5. Speech Contents]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenirElément vide
Note

Par convention, l'élément lb apparaît à l’endroit du texte où commence une nouvelle ligne. L'attribut n, s’il est utilisé, donne un nombre ou une autre valeur associée au texte entre ce point et l’élément suivant lb, spécifiquement le numéro de la ligne dans la page, ou une autre unité de mesure appropriée. Cet élément est prévu pour être employé pour marquer un saut de ligne sur un manuscrit ou sur une page imprimée, à l’endroit où il se survient; on n’utilisera pas de balisage structurel comme une succession de vers (pour lequel l’élément l est disponible) sauf dans le cas où des blocs structurés ne peuvent pas être marqués autrement.

L'attribut type sera employé pour caractériser toute espèce de caractéristiques du saut de ligne, sauf la coupure des mots (indique par l'attribut break) ou la source concernée.

Exemple

Cet exemple montre les sauts de ligne dans des vers, qui apparaissent à différents endroits selon les éditions.

<l>Of Mans First Disobedience,<lb ed="1674"/> and<lb ed="1667"/> the Fruit</l>
<l>Of that Forbidden Tree, whose<lb ed="1667 1674"/> mortal tast</l>
<l>Brought Death into the World,<lb ed="1667"/> and all<lb ed="1674"/> our woe,</l>
Exemple

Cet exemple encode les sauts de ligne pour montre l'apparence visuelle d'une page titre. L'attribut break est utilisé pour montrer que le saut de ligne ne marque pas le début d'un nouveau mot.

<titlePart rend="italic">
 <lb/>L'auteur susdict supplie les Lecteurs
<lb/>benevoles, soy reserver à rire au
soi-<lb break="no"/>xante &amp; dixhuytiesme livre.

</titlePart>
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element lb
{
   att.global.attributes,
   att.typed.attributes,
   att.edition.attributes,
   att.spanning.attributes,
   att.breaking.attributes,
   att.cmc.attributes,
   empty
}

<lg>

<lg> (groupe de vers) contient un groupe de vers fonctionnant comme une unité formelle, par exemple une strophe, un refrain, un paragraphe en vers, etc. [3.13.1. Core Tags for Verse 3.13. Passages of Verse or Drama 7.2.5. Speech Contents]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

ne contient que des vers ou des groupes de vers enchâssés, éventuellement précédés d'un titre.

Exemple
<div type="sonnet">
 <lg type="quatrain">
  <l>Les amoureux fervents et les savants austères</l>
  <l>Aiment également, dans leur mûre saison,</l>
  <l>Les chats puissants et doux, orgueil de la maison,</l>
  <l>Qui comme eux sont frileux et comme eux sédentaires.</l>
 </lg>
 <lg type="quatrain">
  <l>Amis de la science et de la volupté</l>
  <l>Ils cherchent le silence et l'horreur des ténèbres ;</l>
  <l>L'Erèbe les eût pris pour ses coursiers funèbres,</l>
  <l>S'ils pouvaient au servage incliner leur fierté.</l>
 </lg>
 <lg type="tercet">
  <l>Ils prennent en songeant les nobles attitudes</l>
  <l>Des grands sphinx allongés au fond des solitudes,</l>
  <l>Qui semblent s'endormir dans un rêve sans fin ;</l>
 </lg>
 <lg type="tercet">
  <l>Leurs reins féconds sont pleins d'étincelles magiques,</l>
  <l>Et des parcelles d'or, ainsi qu'un sable fin,</l>
  <l>Etoilent vaguement leurs prunelles mystiques.</l>
 </lg>
</div>
Schematron

<sch:rule context="tei:lg">
<sch:assert test="count(descendant::tei:lg|descendant::tei:l|descendant::tei:gap) > 0">An lg element must contain at least one child l, lg, or gap element.</sch:assert>
</sch:rule>
Schematron

<sch:rule context="tei:lg">
<sch:report test="ancestor::tei:l[not(.//tei:note//tei:lg[. = current()])]">Abstract model violation: Lines may not contain line groups.</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divTop"/>
   <classRef key="model.global"/>
  </alternate>
  <alternate>
   <classRef key="model.lLike"/>
   <classRef key="model.stageLike"/>
   <classRef key="model.labelLike"/>
   <classRef key="model.pPart.transcriptional"/>
   <elementRef key="lg"/>
  </alternate>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.lLike"/>
   <classRef key="model.stageLike"/>
   <classRef key="model.labelLike"/>
   <classRef key="model.pPart.transcriptional"/>
   <classRef key="model.global"/>
   <elementRef key="lg"/>
  </alternate>
  <sequence minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divBottom"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element lg
{
   att.global.attributes,
   att.divLike.attributes,
   att.typed.attributes,
   att.declaring.attributes,
   att.cmc.attributes,
   (
      ( model.divTop | model.global )*,
      (
         model.lLikemodel.stageLikemodel.labelLikemodel.pPart.transcriptionallg
      ),
      (
         model.lLikemodel.stageLikemodel.labelLikemodel.pPart.transcriptionalmodel.globallg
      )*,
      ( ( model.divBottom, model.global* )* )
   )
}

<licence>

<licence> contient des informations légales applicables au texte, notamment le contrat de licence définissant les droits d'utilisation. [2.2.4. Publication, Distribution, Licensing, etc.]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
header: availability
Peut contenir
Note

A licence element should be supplied for each licence agreement applicable to the text in question. The target attribute may be used to reference a full version of the licence. The when, notBefore, notAfter, from or to attributes may be used in combination to indicate the date or dates of applicability of the licence.

Exemple
<licence target="http://creativecommons.org/licenses/by/3.0/deed.fr"> Creative Commons Attribution 3.0 non transposé (CC BY 3.0)
</licence>
Exemple
<licence target="http://creativecommons.org/licenses/by-sa/2.0/"> Ce document
est publié librement sur le web à destination de la communauté scientifique
dans le cadre de la licence Creative Commons « Paternité-Pas d’Utilisation
Commerciale-Partage des Conditions Initiales à l’Identique 2.0 France ».
</licence>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element licence
{
   att.global.attributes,
   att.pointing.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.specialPara
}

<list>

<list> (liste) contient une suite d'items ordonnés dans une liste. [3.8. Lists]
Modulecore
Attributs
type(type) describes the nature of the items in the list.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

La syntaxe formelle des déclarations d'élément permet d'omettre les étiquettes de balises des listes balisées par <list type="gloss"> mais c'est une erreur sémantique.

Membre du
Contenu dans
Peut contenir
Note

Peut contenir un titre facultatif suivi d'une succession d'items ou d'une succession de couples constitués d'une étiquette et d'un item, ce dernier type pouvant être précédé par un ou deux titres spécifiques.

Exemple
<list rend="bulleted">
 <item>Thé sans sucre et sans lait </item>
 <item>Un jus d'ananas</item>
 <item>Un yaourt</item>
 <item>Trois biscuits de seigle </item>
 <item>Carottes râpées</item>
 <item>Côtelettes d'agneau (deux)</item>
 <item>Courgettes</item>
 <item>Chèvre frais </item>
 <item>Coings</item>
</list>
Exemple
<div>
 <p> Selon des critères qui n'appartiennent qu'à lui, Rémi Plassaert a classé ses buvards
   en huit tas respectivement surmontés par :</p>
 <list rend="bulleted">
  <item>un toréador chantant (dentifrice émail Diamant)</item>
  <item>un tapis d'Orient du XVIIe siècle, provenant d'une basilique de Transylvanie
     (Kalium-Sedaph, soluté de propionate de potassium)</item>
  <item>Le Renard et la Cicogne (sic), gravure de Jean-Baptiste Oudry (Papeteries
     Marquaize, Stencyl, Reprographie)</item>
 </list>
</div>
Exemple
<div>
 <p> [...] et tout autour, la longue cohorte de ses personnages, avec leur histoire, leur
   passé, leurs légendes :</p>
 <list rend="numbered">
  <item n="1">Pélage vainqueur d'Alkhamah se faisant couronner à Covadonga </item>
  <item n="2">La cantatrice exilée de Russie suivant Schönberg à Amsterdam</item>
  <item n="3">Le petit chat sourd aux yeux vairons vivant au dernier étage</item>
  <item n="4">Le crétin chef d'îlot faisant préparer des tonneaux de sable</item>
 </list>
</div>
Schematron

<sch:rule context="tei:list[@type='gloss']">
<sch:assert test="tei:label">The content of a "gloss" list should include a sequence of one or more pairs of a label element followed by an item element</sch:assert>
</sch:rule>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divTop"/>
   <classRef key="model.global"/>
   <elementRef key="descminOccurs="0"
    maxOccurs="unbounded"/>

  </alternate>
  <alternate>
   <sequence minOccurs="1"
    maxOccurs="unbounded">

    <elementRef key="item"/>
    <classRef key="model.global"
     minOccurs="0maxOccurs="unbounded"/>

   </sequence>
   <sequence>
    <elementRef key="headLabel"
     minOccurs="0"/>

    <elementRef key="headItem"
     minOccurs="0"/>

    <sequence minOccurs="1"
     maxOccurs="unbounded">

     <elementRef key="label"/>
     <classRef key="model.global"
      minOccurs="0maxOccurs="unbounded"/>

     <elementRef key="item"/>
     <classRef key="model.global"
      minOccurs="0maxOccurs="unbounded"/>

    </sequence>
   </sequence>
  </alternate>
  <sequence minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divBottom"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element list
{
   att.global.attributes,
   att.sortable.attributes,
   att.typed.attribute.subtype,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   (
      ( model.divTop | model.global | desc* )*,
      (
         ( ( item, model.global* )+ )
       | (
            headLabel?,
            headItem?,
            ( ( label, model.global*, item, model.global* )+ )
         )
      ),
      ( ( model.divBottom, model.global* )* )
   )
}

<listBibl>

<listBibl> (liste de références bibliographiques) contient une liste de références bibliographiques de toute nature. [3.12.1. Methods of Encoding Bibliographic References and Lists of References 2.2.7. The Source Description 16.3.2. Declarable Elements]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<listBibl>
 <head>Liste des ouvrages cités</head>
 <bibl>Les Petits Romantiques </bibl>
 <biblStruct>
  <analytic>
   <title>La poésie en prose</title>
  </analytic>
  <monogr>
   <title>Aloysius Bertrand, "inventeur" du poème en prose</title>
   <author>Bert Guégand</author>
   <imprint>
    <publisher>PUN</publisher>
    <date>2000</date>
   </imprint>
  </monogr>
 </biblStruct>
</listBibl>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.headLike"
   minOccurs="0maxOccurs="unbounded"/>

  <elementRef key="descminOccurs="0"
   maxOccurs="unbounded"/>

  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.milestoneLike"
    minOccurs="1maxOccurs="1"/>

   <elementRef key="relationminOccurs="1"
    maxOccurs="1"/>

   <elementRef key="listRelation"
    minOccurs="1maxOccurs="1"/>

  </alternate>
  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <classRef key="model.biblLike"
    minOccurs="1maxOccurs="unbounded"/>

   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <classRef key="model.milestoneLike"
     minOccurs="1maxOccurs="1"/>

    <elementRef key="relation"
     minOccurs="1maxOccurs="1"/>

    <elementRef key="listRelation"
     minOccurs="1maxOccurs="1"/>

   </alternate>
  </sequence>
 </sequence>
</content>
Schéma Declaration
element listBibl
{
   att.global.attributes,
   att.sortable.attributes,
   att.declarable.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   (
      model.headLike*,
      desc*,
      ( model.milestoneLike | relation | listRelation )*,
      (
         (
            model.biblLike+,
            ( model.milestoneLike | relation | listRelation )*
         )+
      )
   )
}

<mentioned>

<mentioned> marque des mots ou des expressions employés métalinguistiquement [3.3.3. Quotation]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
Aucune ville ne répond mieux à
l'expressioin <mentioned>sortie de terre</mentioned> que New York
(ou faudrait-il plutôt dire <mentioned>jaillie</mentioned>) :
Exemple
L’harmonisation
vocalique régressive empêche que <mentioned>agwêdê</mentioned> puisse être interprété comme
un dérivé de <mentioned>gwada</mentioned>, qui pourtant est de même racine.
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element mentioned
{
   att.global.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<milestone>

<milestone> (borne) marque un point permettant de délimiter les sections d'un texte selon un autre systeme que les éléments de structure ; une balise de ce type marque une frontière. [3.11.3. Milestone Elements]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenirElément vide
Note

Pour cet élément, l'attribut global n affecte un nouveau numéro ou une autre valeur à l'unité qui change à partir de l'élément milestone. La valeur unnumbered doit être utilisée pour les passages qui sortent du système normal de numérotation (par ex. titres de chapitres, numéros ou titres de poèmes, ou noms des personnages qui prennent la parole dans une pièce de théâtre).

L'ordre dans lequel apparaissent les éléments milestone à un endroit donné n'est en principe pas signifiant.

Exemple
<milestone n="23ed="Launit="Dreissiger"/>
... <milestone n="24ed="AVunit="verse"/> ...
Exemple
<milestone n="23ed="Launit="Dreissiger"/> ... <milestone n="24ed="AVunit="verse"/>
...
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element milestone
{
   att.global.attributes,
   att.milestoneUnit.attributes,
   att.typed.attributes,
   att.edition.attributes,
   att.spanning.attributes,
   att.breaking.attributes,
   att.cmc.attributes,
   empty
}

<name>

<name> (nom, nom propre) contient un nom propre ou un syntagme nominal. [3.6.1. Referring Strings]
Modulecore
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Note

Les noms propres relatifs aux personnes, aux lieux et aux organismes peuvent également être balisés à l'aide de <persName>, <placeName>, ou <orgName>, lorsque le module TEI concernant les noms et dates est inclus.

Exemple
<name type="person">Thomas Hoccleve</name>
<name type="place">Villingaholt</name>
<name type="org">Vetus Latina Institut</name>
<name type="personref="#HOC001">Occleve</name>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element name
{
   att.global.attributes,
   att.personal.attributes,
   att.datable.attributes,
   att.editLike.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq
}

<note>

<note> (note) contient une note ou une annotation [3.9.1. Notes and Simple Annotation 2.2.6. The Notes Statement 3.12.2.8. Notes and Statement of Language 10.3.5.4. Notes within Entries]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<p>J'écris dans la<lb/> marge...<lb/> Je vais<lb/> à la ligne.<lb/> Je renvoie à une
note<note type="glossplace="foot"> J'aime beaucoup les renvois en bas de page, même si
   je n'ai rien de particulier à y préciser.</note>en bas de page.</p>
Exemple

L'attribut global n indique le symbole ou le nombre utilisé pour marquer le point d'insertion dans le texte source, comme dans l'exemple suivant :

Mevorakh b. Saadya's
mother, the matriarch of the family during the second half of the
eleventh century, <note n="126anchored="true"> The alleged
mention of Judah Nagid's mother in a letter from 1071 is, in fact,
a reference to Judah's children; cf. above, nn. 111 and
54. </note> is well known from Geniza documents published by Jacob
Mann.

Cependant, si les notes sont ordonnées et numérotées et qu’on veuille reconstruire automatiquement leur numérotation par un traitement informatique, il est inutile d’enregistrer le numéro des notes.

Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element note
{
   att.global.attributes,
   att.placement.attributes,
   att.pointing.attributes,
   att.typed.attributes,
   att.written.attributes,
   att.anchoring.attributes,
   att.cmc.attributes,
   macro.specialPara
}

<notesStmt>

<notesStmt> (mention de notes) rassemble toutes les notes fournissant des informations sur un texte, en plus des informations mentionnées dans d'autres parties de la description bibliographique. [2.2.6. The Notes Statement 2.2. The File Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
Note

des informations hétérogènes ne doivent pas être regroupées dans une même note.

Exemple
<notesStmt>
 <note>Les photographies, héliogravures et cartes postales colorisées signées Lehnert
   &amp; Landrock, de techniques novatrices, sont réellement des œuvres d'art ; elles
   apportent en outre une documentation considérable sur la Tunisie du début du XXe
   siècle.</note>
</notesStmt>
Modèle de contenu
<content>
 <alternate minOccurs="1"
  maxOccurs="unbounded">

  <classRef key="model.noteLike"/>
  <elementRef key="relatedItem"/>
 </alternate>
</content>
Schéma Declaration
element notesStmt { att.global.attributes, ( model.noteLike | relatedItem )+ }

<num>

<num> (numéral) contient un nombre écrit sous une forme quelconque. [3.6.3. Numbers and Measures]
Modulecore
Attributs
typeindique le type de valeur numérique
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

Si une autre typologie est souhaitée, d'autres valeurs peuvent être utilisées pour cet attribut.

valuefournit la valeur d'un nombre sous une forme normalisée.
Statut Optionel
Type de données teidata.numeric
Valeurs une valeur numérique.
Note

La forme normalisée utilisée est définie par le type de données TEI qui concerne les données numériques.

Membre du
Contenu dans
Peut contenir
Note

Les analyses détaillées des quantités et unités de mesure dans les textes historiques peuvent aussi utiliser le mécanisme de structure de traits décrit au chapitre19. Feature Structures. L'élément num est conçu pour un usage dans des applications simples.

Exemple
<p>Pierre eut <num type="cardinalvalue="10">dix</num>ans le jour de mon<num type="ordinalvalue="21">vingtième </num> anniversaire.</p>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element num
{
   att.global.attributes,
   att.typed.attribute.subtype,
   att.ranging.attributes,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   attribute value { teidata.numeric }?,
   macro.phraseSeq
}

<opener>

<opener> (formule de début) regroupe la date, la mention de responsabilité, la formule de politesse et d'autres expressions de ce type dans un groupe préliminaire au début d’une division, en particulier au commencement d’une lettre. [4.2. Elements Common to All Divisions]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
textstructure: body div group postscript
Peut contenir
Exemple
<opener>
 <dateline>Avignon, le 11 février.</dateline>
</opener>
Exemple
<opener>
 <dateline>
  <name type="place"> à Paris </name>, <date>le 2 septembre 1769</date>
 </dateline>
</opener>
<p>Mais non, ma bonne amie, vous n' aviez pas raison de vous plaindre... </p>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <elementRef key="argument"/>
  <elementRef key="byline"/>
  <elementRef key="dateline"/>
  <elementRef key="epigraph"/>
  <elementRef key="salute"/>
  <elementRef key="signed"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element opener
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      text
    | model.gLikemodel.phraseargumentbylinedatelineepigraphsalutesignedmodel.global
   )*
}

<orig>

<orig> (forme originale) contient une partie notée comme étant fidèle à l'original et non pas normalisée ou corrigée. [3.5.2. Regularization and Normalization 13. Critical Apparatus]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple

Si on veut privilégier la version originale du texte, orig sera utilisé seul:

<p>si mes pensées se sont entretenues des occurences <orig>estrangieres</orig> quelque
partie du temps, quelque autre partie je les <orig>rameine</orig> à la promenade, au<orig> vergier</orig>, à la douceur de cette solitude et à moy. </p>
Exemple

Généralement, orig sera associé à la forme corrigée dans un élément choice.

<l>Un bienfait perd sa grâce à le trop <choice>
  <orig>oublier</orig>
  <corr>publier</corr>
 </choice> ; </l>
<l>Qui veut qu'on s'en souvienne, il le faut <choice>
  <orig>publier</orig>
  <corr>oublier</corr>
 </choice>.</l>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element orig { att.global.attributes, att.cmc.attributes, macro.paraContent }

<p>

<p> (paragraphe) marque les paragraphes dans un texte en prose. [3.1. Paragraphs 7.2.5. Speech Contents]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<div>
 <p>C'était à Mégara, faubourg de Carthage, dans les jardins d'Hamilcar.</p>
 <p>Les soldats qu'il avait commandés en Sicile se donnaient un grand festin pour célébrer
   le jour anniversaire de la bataille d'Eryx, et comme le maître était absent et qu'ils se
   trouvaient nombreux, ils mangeaient et ils buvaient en pleine liberté.</p>
</div>
Schematron

<sch:rule context="tei:p">
<sch:report test="(ancestor::tei:ab or ancestor::tei:p) and not( ancestor::tei:floatingText | parent::tei:exemplum | parent::tei:item | parent::tei:note | parent::tei:q | parent::tei:quote | parent::tei:remarks | parent::tei:said | parent::tei:sp | parent::tei:stage | parent::tei:cell | parent::tei:figure )"> Abstract model violation: Paragraphs may not occur inside other paragraphs or ab elements.
</sch:report>
</sch:rule>
Schematron

<sch:rule context="tei:p">
<sch:report test="( ancestor::tei:l or ancestor::tei:lg ) and not( ancestor::tei:floatingText | parent::tei:figure | parent::tei:note )"> Abstract model violation: Lines may not contain higher-level structural elements such as div, p, or ab, unless p is a child of figure or note, or is a descendant of floatingText.
</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element p
{
   att.global.attributes,
   att.declaring.attributes,
   att.fragmentable.attributes,
   att.written.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<pb>

<pb> (début de page) marque le début d'une page de texte dans un document paginé. [3.11.3. Milestone Elements]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenirElément vide
Note

Un élément pb apparaît au début de la page à laquelle il se rapporte. L'attribut global n donne un numéro ou une autre valeur associée à cette page. Ce sera normalement le numéro de page ou la signature qui y est imprimée, puisque le numéro d'ordre matériel est implicite avec l'élément pb lui-même.

L' attribut type sera employé pour indiquer toutes ses caractéristiques du saut de page, par exemple comme coupure de mot ou non.

Exemple

Page numbers may vary in different editions of a text.

<p> ... <pb n="145ed="ed2"/>
<!-- Page 145 in edition "ed2" starts here --> ... <pb n="283ed="ed1"/>
<!-- Page 283 in edition "ed1" starts here--> ... </p>
Exemple

A page break may be associated with a facsimile image of the page it introduces by means of the facs attribute

<body>
 <pb n="1facs="page1.png"/>
<!-- page1.png contains an image of the page; the text it contains is encoded here -->
 <p>
<!-- ... -->
 </p>
 <pb n="2facs="page2.png"/>
<!-- similarly, for page 2 -->
 <p>
<!-- ... -->
 </p>
</body>
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element pb
{
   att.global.attributes,
   att.typed.attributes,
   att.edition.attributes,
   att.spanning.attributes,
   att.breaking.attributes,
   att.cmc.attributes,
   empty
}

<pc>

<pc> (punctuation character) contient un caractère ou une chaîne de caractères considérés comme un signe de ponctuation unique. [18.1.2. Below the Word Level 18.4.2. Lightweight Linguistic Annotation]
Moduleanalysis
Attributs
forceindicates the extent to which this punctuation mark conventionally separates words or phrases
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
strong
the punctuation mark is a word separator
weak
the punctuation mark is not a word separator
inter
the punctuation mark may or may not be a word separator
unitprovides a name for the kind of unit delimited by this punctuation mark.
Statut Optionel
Type de données teidata.enumerated
preindicates whether this punctuation mark precedes or follows the unit it delimits.
Statut Optionel
Type de données teidata.truthValue
Membre du
Contenu dans
Peut contenir
des données textuelles
Exemple
<phr>
 <w>do</w>
 <w>you</w>
 <w>understand</w>
 <pc type="interrogative">?</pc>
</phr>
Exemple

Example encoding of the German sentence Wir fahren in den Urlaub., encoded with attributes from att.linguistic discussed in section [ID AILALW in TEI Guidelines].

<s>
 <w pos="PPERmsd="1.Pl.*.Nom">Wir</w>
 <w pos="VVFINmsd="1.Pl.Pres.Ind">fahren</w>
 <w pos="APPRmsd="--">in</w>
 <w pos="ARTmsd="Def.Masc.Akk.Sg.">den</w>
 <w pos="NNmsd="Masc.Akk.Sg.">Urlaub</w>
 <pc pos="$.msd="--join="left">.</pc>
</s>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <elementRef key="c"/>
  <classRef key="model.pPart.edit"/>
 </alternate>
</content>
Schéma Declaration
element pc
{
   att.global.attributes,
   att.segLike.attributes,
   att.typed.attributes,
   att.linguistic.attributes,
   att.cmc.attributes,
   attribute force { "strong" | "weak" | "inter" }?,
   attribute unit { teidata.enumerated }?,
   attribute pre { teidata.truthValue }?,
   ( text | model.gLike | c | model.pPart.edit )*
}

<postscript>

<postscript> contient un post-scriptum, par exemple au bas d' une lettre. [4.2. Elements Common to All Divisions]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<div type="letter">
 <opener>
  <dateline>
   <date when="1942">Printemps 1942 </date>
  </dateline>
  <salute>Cher ami, </salute>
 </opener>
 <p>Le printemps vient maintenant. J'espère que là où tu es le climat à cette saison n'est
   pas encore pénible. C'est le moment des travaux des champs ; peut-être arrivera-t-on à
   quelque chose pour toi. S'il n'y a pas moyen de te faire venir en France, faut-il faire
   des démarches pour essayer de te faire quitter l'Europe ? Écris-le-moi. </p>
 <p>[...] </p>
 <closer>
  <salute> Crois à mon amitié fraternelle. </salute>
  <signed>Simone Weil </signed>
 </closer>
 <postscript>
  <label>P.S.</label>
  <p>Voici la traduction de quelques vers grecs d'Eschyle. Ils sont prononcés par
     Prométhée, le dieu qui, d'après les croyances des Grecs, avait sauvé les hommes de la
     destruction, avait volé le feu pour le leur donner et leur avait appris le langage, le
     nombre, l'astronomie, les métiers et les arts. Il en fut puni et fut cloué sur un
     rocher. La tragédie d'Eschyle commence par la scène où on le cloue ; il se tait
     pendant ce temps, puis, quand ses bourreaux sont partis, il dit : [...]</p>
 </postscript>
</div>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.global"/>
   <classRef key="model.divTopPart"/>
  </alternate>
  <classRef key="model.common"/>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.global"/>
   <classRef key="model.common"/>
  </alternate>
  <sequence minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divBottomPart"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element postscript
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      ( model.global | model.divTopPart )*,
      model.common,
      ( model.global | model.common )*,
      ( ( model.divBottomPart, model.global* )* )
   )
}

<principal>

<principal> (chercheur principal) contient le nom du chercheur qui est principalement responsable de la création d’un texte électronique. [2.2.1. The Title Statement]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Exemple
<principal xml:id="fr_AEU-2">Anne-Élisabeth Urfels-Capot</principal>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element principal
{
   att.global.attributes,
   att.canonical.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq.limited
}

<profileDesc>

<profileDesc> (description du profil) fournit une description détaillée des aspects non bibliographiques du texte, notamment les langues utilisées et leurs variantes, les circonstances de sa production, les collaborateurs et leur statut. [2.4. The Profile Description 2.1.1. The TEI Header and Its Components]
Moduleheader
Attributs
Membre du
Contenu dans
header: teiHeader
Peut contenir
Note

Although the content model permits it, it is rarely meaningful to supply multiple occurrences for any of the child elements of profileDesc unless these are documenting multiple texts.

Exemple
<profileDesc>
 <langUsage>
  <language ident="fr">français</language>
 </langUsage>
 <textDesc n="roman">
  <channel mode="w">copie; extraits </channel>
  <constitution type="single"/>
  <derivation type="original"/>
  <domain type="art"/>
  <factuality type="fiction"/>
  <interaction type="none"/>
  <preparedness type="prepare"/>
  <purpose type="distractiondegree="high"/>
  <purpose type="information"
   degree="medium"/>

 </textDesc>
 <settingDesc>
  <setting>
   <name>Paris, France</name>
   <time>Fin 19e</time>
  </setting>
 </settingDesc>
</profileDesc>
Modèle de contenu
<content>
 <classRef key="model.profileDescPart"
  minOccurs="0maxOccurs="unbounded"/>

</content>
Schéma Declaration
element profileDesc { att.global.attributes, model.profileDescPart* }

<projectDesc>

<projectDesc> (description du projet) décrit en détail le but ou l’objectif visé dans l’encodage d’un fichier électronique, ainsi que toute autre information pertinente sur la manière dont il a été construit ou recueilli. [2.3.1. The Project Description 2.3. The Encoding Description 16.3.2. Declarable Elements]
Moduleheader
Attributs
Membre du
Contenu dans
header: encodingDesc
Peut contenir
core: p
Exemple
<projectDesc>
 <p>La saisie a été effectuée par notre partenaire Datactivity. Le texte saisi a été
   ensuite converti et remis en forme selon les normes du format XML, standard d’échange ou
   d’affichage de documents permettant de séparer la forme et le contenu et offrant une
   déclinaison d’outils qui donnent la possibilité d’exploiter un texte comme une véritable
   base de données. La norme adoptée (DTD) est le TEI (Text Encoding Initiative). </p>
 <p> Affichage et manipulation du texte (mise au format, filtrage, réorganisation) se font
   sur un serveur Apache à l'aide de l'infrastructure Axkit.</p>
 <p> Le moteur logiciel du site a été développé en Xpathscript et s'appuie sur les travaux
   de Dominique Quatravaux (Alliance Francophone Pour l'Avancement d'XPathScript) et de
   Yanick Champoux (support de Libxml via YPathScript).</p>
 <p>Les programmes développés pour le site sont mis à la disposition en open-source sur
   demande (contacter Alexandre Gefen). </p>
 <p>Les fonctions de recherche plein texte sont fournies par Philologic dans le cadre du
   partenariat du projet avec ARTFL.</p>
 <p>L’architecture de travail, sous Linux, est destinée à garantir une haute disponibilité
   et des performances optimales. La liaison avec Internet est assurée par les services
   informatiques de l’Université de Neuchâtel (SITEL).</p>
</projectDesc>
Modèle de contenu
<content>
 <classRef key="model.pLikeminOccurs="1"
  maxOccurs="unbounded"/>

</content>
Schéma Declaration
element projectDesc
{
   att.global.attributes,
   att.declarable.attributes,
   model.pLike+
}

<ptr>

<ptr> (pointeur) définit un pointeur vers un autre emplacement. [3.7. Simple Links and Cross-References 17.1. Links]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenirElément vide
Exemple
<ptr target="#p143 #p144"/>
<ptr target="http://www.tei-c.org"/>
<ptr cRef="1.3.4"/>
Schematron

<sch:rule context="tei:ptr">
<sch:report test="@target and @cRef">Only one of the attributes @target and @cRef may be supplied on <sch:name/>.</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <empty/>
</content>
Schéma Declaration
element ptr
{
   att.cReferencing.attributes,
   att.declaring.attributes,
   att.global.attributes,
   att.pointing.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   empty
}

<publicationStmt>

<publicationStmt> (mention de publication) regroupe des informations concernant la publication ou la diffusion d’un texte électronique ou d’un autre type de texte. [2.2.4. Publication, Distribution, Licensing, etc. 2.2. The File Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
Note

Bien que non imposé par les schémas, un document conforme à la TEI doit donner des informations sur le lieu de publication, l'adresse, l'identifiant, les droits de diffusion et la date dans cet ordre, après le nom de l'éditeur, du distributeur, ou de l'autorité concernée.

Exemple
<publicationStmt>
 <publisher>C. Muquardt </publisher>
 <pubPlace>Bruxelles &amp; Leipzig</pubPlace>
 <date when="1846"/>
</publicationStmt>
Exemple
<publicationStmt>
 <distributor>ATILF (Analyse et Traitement Informatique de la Langue Française)</distributor>
 <idno type="FRANTEXT">L434</idno>
 <address>
  <addrLine>44, avenue de la Libération</addrLine>
  <addrLine>BP 30687</addrLine>
  <addrLine>54063 Nancy Cedex</addrLine>
  <addrLine>FRANCE</addrLine>
 </address>
 <availability status="free">
  <p>Dans un cadre de recherche ou d'enseignement</p>
 </availability>
</publicationStmt>
Modèle de contenu
<content>
 <alternate>
  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <classRef key="model.publicationStmtPart.agency"/>
   <classRef key="model.publicationStmtPart.detail"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

 </alternate>
</content>
Schéma Declaration
element publicationStmt
{
   att.global.attributes,
   (
      (
         (
            model.publicationStmtPart.agency,
            model.publicationStmtPart.detail*
         )+
      )
    | model.pLike+
   )
}

<publisher>

<publisher> (éditeur) donne le nom de l'organisme responsable de la publication ou de la distribution d'un élément de la bibliographie. [3.12.2.4. Imprint, Size of a Document, and Reprint Information 2.2.4. Publication, Distribution, Licensing, etc.]
Modulecore
Attributs
Membre du
Contenu dans
core: bibl
textstructure: docImprint
Peut contenir
Note

Utiliser la forme développée du nom au moyen duquel l'organisme est habituellement cité, plutôt qu'une abréviation, cette dernière pouvant apparaître sur une page de titre.

Exemple
<imprint>
 <pubPlace>Paris</pubPlace>
 <publisher>Les Éditions de Minuit</publisher>
 <date>2001</date>
</imprint>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element publisher
{
   att.global.attributes,
   att.canonical.attributes,
   macro.phraseSeq
}

<pubPlace>

<pubPlace> (lieu de publication) contient le nom du lieu d'une publication. [3.12.2.4. Imprint, Size of a Document, and Reprint Information]
Modulecore
Attributs
Membre du
Contenu dans
core: bibl
textstructure: docImprint
Peut contenir
Exemple
<publicationStmt>
 <publisher>Editions Denoëll</publisher>
 <pubPlace>Paris</pubPlace>
 <date>1975</date>
</publicationStmt>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element pubPlace
{
   att.global.attributes,
   att.naming.attributes,
   macro.phraseSeq
}

<q>

<q> (séparé du texte environnant par des guillemets) contient un fragment qui est marqué (visiblement) comme étant d’une manière ou d'une autre différent du texte environnant, pour diverses raisons telles que, par exemple, un discours direct ou une pensée, des termes techniques ou du jargon, une mise à distance par rapport à l’auteur, des citations empruntées et des passages qui sont mentionnés mais non employés. [3.3.3. Quotation]
Modulecore
Attributs
type(type) peut être utilisé pour indiquer si le passage cité correspond à une parole ou à une pensée ou encore pour le caractériser plus finement.
Statut Optionel
Type de données teidata.enumerated
Les valeurs suggérées comprennent:
spoken
(spoken) notation du discours direct
thought
(thought) représentation de la pensée, par exemple un monologue intérieur.
written
(written) citation d'une source écrite
soCalled
(so called) distance prise par rapport à l'auteur
foreign
(foreign) mots étrangers
distinct
(distinct) linguistiquement distinct
term
terme technique
emph
(emph) mis en valeur par un procédé rhétorique.
mentioned
(mentioned) métalinguistic, i.e. faisant référence à lui-même et non à son référent habituel.
Membre du
Contenu dans
Peut contenir
Note

Peut être utilisé pour indiquer qu'un passage est distingué du texte environnant par des guillemets, pour des raisons non explicitées. Lorsqu'il est utilisé ainsi, q peut être considéré comme un encodage plus lisible (sucre syntaxique) pour hi avec une valeur de rend indiquant la fonction des guillemets.

Exemple
<p>Si quelque serrure allait mal, il l'avait bientôt démontée, rafistolée, huilée, limée,
remontée, en disant :<q>ça me connaît</q>.</p>
Exemple
<p>Enfin je me rappelai le pis-aller d’une grande princesse à
qui l’on disait que les paysans n’avaient pas de pain, et qui
répondit : <q>Qu’ils mangent de la brioche.</q>
</p>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element q
{
   att.global.attributes,
   att.ascribed.directed.attributes,
   att.cmc.attributes,
   attribute type
   {
      "spoken"
    | "thought"
    | "written"
    | "soCalled"
    | "foreign"
    | "distinct"
    | "term"
    | "emph"
    | "mentioned"
    | teidata.enumerated
   }?,
   macro.specialPara
}

<ref>

<ref> (référence) définit une référence vers un autre emplacement, la référence étant éventuellement modifiée ou complétée par un texte ou un commentaire. [3.7. Simple Links and Cross-References 17.1. Links]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

Les attributs target et cRef sont exclusifs l'un de l'autre.

Exemple
Cf. tout particulièrement <ref target="#SEC12">la section 12, page 34</ref>.
Exemple
Cf. tout particulièrement
<ref cRef="B1/234">le vers 234 du Livre I</ref>
Schematron

<sch:rule context="tei:ref">
<sch:report test="@target and @cRef">Only one of the attributes @target' and @cRef' may be supplied on <sch:name/>
</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element ref
{
   att.cReferencing.attributes,
   att.declaring.attributes,
   att.global.attributes,
   att.pointing.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<refsDecl>

<refsDecl> (Déclaration du système de références) précise la manière dont les références canoniques ont été construites pour ce texte. [2.3.6.3. Milestone Method 2.3. The Encoding Description 2.3.6. The Reference System Declaration]
Moduleheader
Attributs
Membre du
Contenu dans
header: encodingDesc
Peut contenir
core: p
Exemple
<refsDecl xml:id="fr_ASLREF">
 <cRefPattern matchPattern="(\S+) ([^.]+)\.(.*)"
  replacementPattern="#fr_xpath(//div1[@n='$1']/div2/[@n='$2']//lb[@n='$3'])">

  <p>Une référence a été créée en assemblant les éléments suivants dans l'ordre inverse de
     la liste qui suit : <list>
    <item>la valeur <att>n</att> du précédent <gi>lb</gi>
    </item>
    <item>une période</item>
    <item>la valeur <att>n</att> de l'ancêtre <gi>div2</gi>
    </item>
    <item>un espace</item>
    <item>la valeur<att>n</att> du parent <gi>div1</gi>
    </item>
   </list>
  </p>
 </cRefPattern>
</refsDecl>
Modèle de contenu
<content>
 <alternate>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

  <elementRef key="citeStructure"
   minOccurs="1maxOccurs="unbounded"/>

  <elementRef key="cRefPattern"
   minOccurs="1maxOccurs="unbounded"/>

  <elementRef key="refStateminOccurs="1"
   maxOccurs="unbounded"/>

 </alternate>
</content>
Schéma Declaration
element refsDecl
{
   att.global.attributes,
   att.declarable.attributes,
   ( model.pLike+ | citeStructure+ | cRefPattern+ | refState+ )
}

<reg>

<reg> (régularisation) contient une partie qui a été régularisée ou normalisée de façon quelconque [3.5.2. Regularization and Normalization 13. Critical Apparatus]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple

Si on veut attirer l'attention sur le fait que le texte a été régularisé, reg est utilisé seul :

<l>
 <reg>Maître</reg> Corbeau sur un arbre perché,
</l>
<l>
 <reg>Tenait</reg> en son bec un fromage.
</l>
Exemple

Il est également possible d'identifier l'auteur de la régularisation, et avec les éléments choice etorig, donner à la fois la lecture originale et la lecture régularisée.:

<l>
 <choice>
  <orig>Maistre</orig>
  <reg resp="#LB">Maître</reg>
 </choice>Corbeau sur un arbre perché,
</l>
<l>
 <choice>
  <orig>Tenoit</orig>
  <reg resp="#LB">Tenait</reg>
 </choice> en son bec un fromage.
</l>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element reg
{
   att.global.attributes,
   att.editLike.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<relatedItem>

<relatedItem> contient ou référe à un autre élément bibliographique ayant une relation quelconque avec l'objet décrit, par exemple comme faisant partie d'une version alternative de celui-ci, ou bien en étant une version alternative. [3.12.2.7. Related Items]
Modulecore
Attributs
targetpoints to the related bibliographic element by means of an absolute or relative URI reference
Statut Optionel
Type de données teidata.pointer
Membre du
Contenu dans
core: bibl
header: notesStmt
Peut contenir
Note

If the target attribute is used to reference the related bibliographic item, the element must be empty.

Exemple
<biblStruct>
 <monogr>
  <author>Shirley, James</author>
  <title type="main">The gentlemen of Venice</title>
  <imprint>
   <pubPlace>New York</pubPlace>
   <publisher>Readex Microprint</publisher>
   <date>1953</date>
  </imprint>
  <extent>1 microprint card, 23 x 15 cm.</extent>
 </monogr>
 <series>
  <title>Three centuries of drama: English, 1642–1700</title>
 </series>
 <relatedItem type="otherForm">
  <biblStruct>
   <monogr>
    <author>Shirley, James</author>
    <title type="main">The gentlemen of Venice</title>
    <title type="sub">a tragi-comedie presented at the private house in Salisbury
         Court by Her Majesties servants</title>
    <imprint>
     <pubPlace>London</pubPlace>
     <publisher>H. Moseley</publisher>
     <date>1655</date>
    </imprint>
    <extent>78 p.</extent>
   </monogr>
  </biblStruct>
 </relatedItem>
</biblStruct>
Schematron

<sch:rule context="tei:relatedItem">
<sch:report test="@target and count( child::* ) > 0">If the @target attribute on <sch:name/> is used, the relatedItem element must be empty</sch:report>
<sch:assert test="@target or child::*">A relatedItem element should have either a @target attribute or a child element to indicate the related bibliographic item</sch:assert>
</sch:rule>
Modèle de contenu
<content>
 <alternate minOccurs="0">
  <classRef key="model.biblLike"/>
  <classRef key="model.ptrLike"/>
 </alternate>
</content>
Schéma Declaration
element relatedItem
{
   att.global.attributes,
   att.typed.attributes,
   attribute target { teidata.pointer }?,
   ( model.biblLike | model.ptrLike )?
}

<resp>

<resp> (responsabilité) contient une expression décrivant la nature de la responsabilité intellectuelle d'une personne. [3.12.2.2. Titles, Authors, and Editors 2.2.1. The Title Statement 2.2.2. The Edition Statement 2.2.5. The Series Statement]
Modulecore
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Contenu dans
core: respStmt
Peut contenir
Note

Les attributs key or ref, issus de la classe att.canonical, peuvent être utilisés pour indiquer le type de responsabilité sous une forme normalisée, en faisant référence directement (par l'utilisation de ref) ou indirectement (par l'utilisation de key) à une liste normalisée contenant des types de responsabilité, comme celle qui est maintenue par une autorité de nommage, par exemple la liste http://www.loc.gov/marc/relators/relacode.html à usage bibliographique.

Exemple
<respStmt>
 <resp>compilateur</resp>
 <name>Edward Child</name>
</respStmt>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element resp
{
   att.global.attributes,
   att.canonical.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq.limited
}

<respStmt>

<respStmt> (mention de responsabilité) indique la responsabilité quant au contenu intellectuel d'un texte, d'une édition, d'un enregistrement ou d'une publication en série, lorsque les éléments spécifiques relatifs aux auteurs, éditeurs, etc. ne suffisent pas ou ne s'appliquent pas. [3.12.2.2. Titles, Authors, and Editors 2.2.1. The Title Statement 2.2.2. The Edition Statement 2.2.5. The Series Statement]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
core: name note resp
Exemple
<respStmt>
 <resp>Nouvelle édition originale</resp>
 <persName>Geneviève Hasenohr</persName>
</respStmt>
Exemple
<respStmt>
 <resp>converti en langage SGML</resp>
 <name>Alan Morrison</name>
</respStmt>
Modèle de contenu
<content>
 <sequence>
  <alternate>
   <sequence>
    <elementRef key="respminOccurs="1"
     maxOccurs="unbounded"/>

    <classRef key="model.nameLike.agent"
     minOccurs="1maxOccurs="unbounded"/>

   </sequence>
   <sequence>
    <classRef key="model.nameLike.agent"
     minOccurs="1maxOccurs="unbounded"/>

    <elementRef key="respminOccurs="1"
     maxOccurs="unbounded"/>

   </sequence>
  </alternate>
  <elementRef key="noteminOccurs="0"
   maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element respStmt
{
   att.global.attributes,
   att.canonical.attributes,
   (
      ( ( resp+, model.nameLike.agent+ ) | ( model.nameLike.agent+, resp+ ) ),
      note*
   )
}

<revisionDesc>

<revisionDesc> (descriptif des révisions) fournit un résumé de l’historique des révisions d’un fichier. [2.6. The Revision Description 2.1.1. The TEI Header and Its Components]
Moduleheader
Attributs
Contenu dans
header: teiHeader
Peut contenir
core: list
header: change
Note

Les changements les plus récents apparaissent en début de liste

Exemple
<revisionDesc>
 <list>
  <item>
   <date when="2003-04-12">12 avril 03</date>Dernière révision par F. B.</item>
  <item>
   <date when="2003-03-01">1 mars 03</date> F.B a fait le nouveau fichier.</item>
 </list>
</revisionDesc>
Modèle de contenu
<content>
 <alternate>
  <elementRef key="listminOccurs="1"
   maxOccurs="unbounded"/>

  <elementRef key="listChange"
   minOccurs="1maxOccurs="unbounded"/>

  <elementRef key="changeminOccurs="1"
   maxOccurs="unbounded"/>

 </alternate>
</content>
Schéma Declaration
element revisionDesc
{
   att.global.attributes,
   ( list+ | listChange+ | change+ )
}

<row>

<row> (rangée) contient une rangée d'un tableau. [15.1.1. TEI Tables]
Modulefigures
Attributs
Contenu dans
figures: table
Peut contenir
figures: cell
Exemple
<row role="data">
 <cell role="label">Etudes classiques</cell>
 <cell>Inoccupé indolent et sans amélioration</cell>
</row>
Modèle de contenu
<content>
 <elementRef key="cellminOccurs="1"
  maxOccurs="unbounded"/>

</content>
Schéma Declaration
element row { att.global.attributes, att.tableDecoration.attributes, cell+ }

<rs>

<rs> (chaîne de référence) contient un nom générique ou une chaîne permettant de s'y référer. [14.2.1. Personal Names 3.6.1. Referring Strings]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<p>La famille s'était alors retirée en banlieue, à <rs type="place">Villemomble</rs>, mais
<rs type="person">Alfred </rs>aimait se rendre à <rs type="place">Paris</rs> et un jour de 1917 alors qu'il sortait de <rs type="place">la maison des
   Arts et Métiers</rs> il était tombé inanimé dans la rue.</p>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element rs
{
   att.global.attributes,
   att.naming.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<s>

<s> (phrase) contient une division textuelle de type phrase [18.1. Linguistic Segment Categories 8.4.1. Segmentation]
Moduleanalysis
Attributs
Membre du
Contenu dans
Peut contenir
Note

L'élément s peut être utilisé pour marquer les phrases ou toute autre segmentation existant dans un texte, pourvu que cette segmentation soit présente du début à la fin du texte, complète et sans imbrication. Dans le cas d'une segmentation partielle ou récursive, l'élément seg doit remplacer l'élément s.

L'attribut type peut être utilisé pour indiquer le type de segmentation prévue, selon une typologie appropriée.

Exemple
<s>
 <w>Quand</w>
 <w>partez</w>
 <w>-</w>
 <w>vous</w>
 <w> ?</w>
</s>
<s>
 <w>Demain</w>
 <w>.</w>
</s>
Schematron

<sch:rule context="tei:s">
<sch:report test="tei:s">You may not nest one s element within another: use seg instead</sch:report>
</sch:rule>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element s
{
   att.global.attributes,
   att.segLike.attributes,
   att.typed.attributes,
   att.notated.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<salute>

<salute> (formule de politesse) contient un dédicace ou une formule de salut qui précède un avant-propos ou autre division du texte; ou bien encore la formule de politesse qui conclut une lettre, une préface, etc. [4.2.2. Openers and Closers]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
textstructure: body closer div front group opener
Peut contenir
Exemple
<salute>Faites toutes mes amitiés à votre femme et recevez, mon cher ami, l'expression de
mes sentiments affectueux et dévoués. </salute>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element salute
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<samplingDecl>

<samplingDecl> (déclaration d'échantillonnage) contient une description en texte libre du raisonnement et des méthodes utilisés pour l'échantillonnage des textes dans la création d’un corpus ou d’une collection. [2.3.2. The Sampling Declaration 2.3. The Encoding Description 16.3.2. Declarable Elements]
Moduleheader
Attributs
Membre du
Contenu dans
header: encodingDesc
Peut contenir
core: p
Note

Cet élément rassemble toute information sur l'inclusion ou l'omission systématique de segments du texte, quel que soit le résultat des procédures d'échantillonnage au sens strict, ou de l'omission systématique d'éléments jugés soit trop difficiles à transcrire, soit sans intérêt.

Exemple
<samplingDecl>
 <p>Corpus
   d'échantillons de 2000 mots pris au début de chaque texte. </p>
</samplingDecl>
Modèle de contenu
<content>
 <classRef key="model.pLikeminOccurs="1"
  maxOccurs="unbounded"/>

</content>
Schéma Declaration
element samplingDecl
{
   att.global.attributes,
   att.declarable.attributes,
   model.pLike+
}

<seg>

<seg> (segment quelconque) contient une unité de texte quelconque de niveau ‘segment’. [17.3. Blocks, Segments, and Anchors 6.2. Components of the Verse Line 7.2.5. Speech Contents]
Modulelinking
Attributs
Membre du
Contenu dans
Peut contenir
Note

L'élément seg peut être utilisé à la discrétion de l'encodeur pour baliser tout segment du texte intéressant pour un traitement informatique. L'un des usages de cet élément est d'encoder des caractéristiques textuelles pour lesquelles aucun balisage approprié n'est défini par ailleurs. Un autre usage consiste à fournir un identifiant pour un segment vers lequel pointe un autre élément - c'est-à-dire à fournir une cible, ou une partie de cible, pour un élément ptr ou pour un autre élément similaire.

Exemple
<seg>Quand partez-vous ?</seg>
<seg>Demain.</seg>
Exemple
<s>C' était à <seg type="toponyme">Mégara</seg>, faubourg de <seg type="topon">Carthage</seg>, dans les jardins d' <seg type="patronyme">Hamilcar</seg>. </s>
Exemple
<seg type="preambule">La magnificence et la galanterie n'ont jamais paru en <seg type="toponyme">France</seg> avec tant d'éclat que <seg type="date">dans les dernières
   années du règne de <seg type="patronyme">Henri second</seg>. </seg>
</seg>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element seg
{
   att.global.attributes,
   att.segLike.attributes,
   att.typed.attributes,
   att.written.attributes,
   att.notated.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<seriesStmt>

<seriesStmt> (mention de collection) regroupe toute information relative à la collection (si elle existe) à laquelle appartient une publication. [2.2.5. The Series Statement 2.2. The File Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
Exemple
<seriesStmt>
 <title>Babel</title>
 <respStmt>
  <resp>directeur de collection</resp>
  <name>Jacques Dubois</name>
 </respStmt>
 <respStmt>
  <resp>directeur de collection</resp>
  <name>Hubert Nyssen</name>
 </respStmt>
 <idno type="ISSN">1140-3853</idno>
</seriesStmt>
Modèle de contenu
<content>
 <alternate>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

  <sequence>
   <elementRef key="titleminOccurs="1"
    maxOccurs="unbounded"/>

   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <elementRef key="editor"/>
    <elementRef key="respStmt"/>
   </alternate>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <elementRef key="idno"/>
    <elementRef key="biblScope"/>
   </alternate>
  </sequence>
 </alternate>
</content>
Schéma Declaration
element seriesStmt
{
   att.global.attributes,
   att.declarable.attributes,
   ( model.pLike+ | ( title+, ( editor | respStmt )*, ( idno | biblScope )* ) )
}

<sic>

<sic> (du latin, ainsi) contient du texte reproduit quoiqu'il est apparemment incorrect ou inexact [3.5.1. Apparent Errors]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
Des nuages, des
<sic>cyrrhus</sic>, des nimbus, des cumulus, tant qu'on en veut, et assurément plus que
n'en voulaient le maître et le serviteur.
Exemple

Si on veut seulement attirer l'attention sur ce qui paraît être un problème dans la copie du texte, sic est utilisé seul :

Tel est le
chat Rutterkin des sorcières Margaret et Filippa Flower, qui furent
<sic>prûlées</sic>brûlées à Lincoln, le 11 mars 1619, pour avoir envoûté un parent du comte
de Rutland.
Exemple

Il est également possible, en utilisant les éléments choice et corr, de proposer une lecture corrigée :

Tel est le
chat Rutterkin des sorcières Margaret et Filippa Flower, qui furent<choice>
 <sic>prûlées</sic>
 <corr>brûlées</corr>
</choice> à Lincoln, le 11 mars 1619, pour avoir envoûté un parent du comte de
Rutland.
Exemple
Ouvrage très
véridique et mirifique du Sieur Marcus Publius Dataficus du digne fils du seigneur comte,
vicomte, duc et archiduc Johannus de Bessinguya<choice>
 <sic> Percepteur</sic>
 <corr>Precepteur</corr>
</choice> du digne fils du seigneur comte, vicomte, duc et archiduc Johannus de
Bessinguya.
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element sic { att.global.attributes, att.cmc.attributes, macro.paraContent }

<signed>

<signed> (signature) contient la dernière salutation, ajoutée à un avant-propos, à une dédicace ou à une autre division du texte. [4.2.2. Openers and Closers]
Moduletextstructure
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
<signed>votre fidèle amante, <name>Manon Lescaut.</name>
</signed>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element signed
{
   att.global.attributes,
   att.written.attributes,
   att.cmc.attributes,
   macro.paraContent
}

<soCalled>

<soCalled> (so called) contient une expression ou un mot pour lesquels l'auteur ou le narrateur renonce à toute responsabilité, par exemple en utilisant de l'italique ou des guillemets. [3.3.3. Quotation]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
- On ne
bouge pas, on ne touche à rien, il faut que je prévienne <soCalled>la Maison</soCalled>.
C'est ainsi qu'il appelait le Quai des Orfèvres.
Exemple
<p> Mais, après tout, les propos auxquels on mêlait son nom n'étaient que des propos ; du
bruit, des mots, des paroles, moins que des paroles, des<soCalled>palabres</soCalled>,
comme dit l'énergique langue du midi.</p>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element soCalled { att.global.attributes, att.cmc.attributes, macro.phraseSeq }

<sourceDesc>

<sourceDesc> (description de la source) décrit la source à partir de laquelle un texte électronique a été dérivé ou produit, habituellement une description bibliographique pour un texte numérisé, ou une expression comme ‘document numérique natif’ pour un texte qui n'a aucune existence précédente. [2.2.7. The Source Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
figures: table
Exemple
<sourceDesc>
 <p>Texte original : le texte a été créé sous sa forme électronique.</p>
</sourceDesc>
Modèle de contenu
<content>
 <alternate>
  <classRef key="model.pLikeminOccurs="1"
   maxOccurs="unbounded"/>

  <alternate minOccurs="1"
   maxOccurs="unbounded">

   <classRef key="model.biblLike"/>
   <classRef key="model.sourceDescPart"/>
   <classRef key="model.listLike"/>
  </alternate>
 </alternate>
</content>
Schéma Declaration
element sourceDesc
{
   att.global.attributes,
   att.declarable.attributes,
   (
      model.pLike+
    | ( model.biblLike | model.sourceDescPart | model.listLike )+
   )
}

<sp>

<sp> (langue orale) monologue dans un texte écrit pour la scène ou un passage présenté sous cette forme dans un texte en prose ou en vers. [3.13.2. Core Tags for Drama 3.13. Passages of Verse or Drama 7.2.2. Speeches and Speakers]
Modulecore
Attributs
Membre du
Contenu dans
figures: cell figure
header: change licence
Peut contenir
Note

L'attribut who peut être utilisé soit en complément de l'élément speaker, soit comme une alternative à cet élément.

Exemple
<sp>
 <speaker> Valère.</speaker>
 <p>Hé bien ! Sabine, quel conseil me donneras-tu ?</p>
</sp>
<sp>
 <speaker> Sabine.</speaker>
 <p>Vraiment, il y a bien des nouvelles. Mon oncle veut résolûment que ma cousine épouse
   Villebrequin, et les affaires sont tellement avancées, que je crois qu'ils eussent été
   mariés dès aujourd'hui, si vous n'étiez aimé ... Le bonhomme ne manquera pas
   de faire loger ma cousine à ce pavillon qui est au bout de notre jardin, et par ce moyen
   vous pourriez l'entretenir à l'insu de notre vieillard, l'épouser, et le laisser pester
   tout son soûl avec Villebrequin.</p>
</sp>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="0">
   <elementRef key="speaker"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
  <sequence minOccurs="1"
   maxOccurs="unbounded">

   <alternate>
    <elementRef key="lg"/>
    <classRef key="model.lLike"/>
    <classRef key="model.pLike"/>
    <classRef key="model.listLike"/>
    <classRef key="model.stageLike"/>
    <classRef key="model.attributable"/>
   </alternate>
   <alternate>
    <classRef key="model.global"
     minOccurs="0maxOccurs="unbounded"/>

    <elementRef key="q"/>
   </alternate>
  </sequence>
 </sequence>
</content>
Schéma Declaration
element sp
{
   att.global.attributes,
   att.ascribed.directed.attributes,
   (
      model.global*,
      ( ( speaker, model.global* )? ),
      (
         (
            (
               lgmodel.lLikemodel.pLikemodel.listLikemodel.stageLikemodel.attributable
            ),
            ( model.global* | q )
         )+
      )
   )
}

<speaker>

<speaker> forme particulière de titre ou de marque qui donne le nom d'un ou de plusieurs locuteurs dans un texte ou dans un fragment de texte écrit pour le théâtre. [3.13.2. Core Tags for Drama]
Modulecore
Attributs
Contenu dans
core: sp
Peut contenir
Note

Cet élément est utilisé pour indiquer quel personnage prend la parole dans une pièce de théâtre ; l'attribut who est utilisé pour pointer vers un autre élément qui fournit des informations sur ce personnage. L'un et ou l'autre peuvent être utilisés.

Exemple
<sp who="ko">
 <speaker>Koch.</speaker>
 <p>Ne risquez rien du tout, Monique ; rentrez.</p>
</sp>
<sp who="mo">
 <speaker>Monique.</speaker>
 <p>Rentrer ? comment voulez-vous que je rentre ? J'ai les clés de la voiture.</p>
</sp>
<sp who="ko">
 <speaker>Koch.</speaker>
 <p> Je rentrerai par mes propres moyens. </p>
</sp>
<sp who="mo">
 <speaker>Monique.</speaker>
 <p> Vous ? vos moyens ? quels moyens ? Seigneur ! Vous ne savez même pas conduire, vous ne
   savez pas reconnaître votre gauche de votre droite, vous auriez été incapable de
   retrouver ce fichu quartier tout seul, vous ne savez absolument rien faire tout seul. Je
   me demande bien comment vous pourriez rentrer. </p>
</sp>
<sp who="ko">
 <speaker>Koch.</speaker>
 <p>J'appellerai un taxi.</p>
</sp>
<list type="speakers">
 <item xml:id="fr_mo"/>
 <item xml:id="fr_ko"/>
</list>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element speaker { att.global.attributes, macro.phraseSeq }
<sponsor> (commanditaire) indique le nom d’une institution ou d’un organisme partenaires. [2.2.1. The Title Statement]
Moduleheader
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
Membre du
Contenu dans
Peut contenir
Note

Les commanditaires apportent leur caution intellectuelle à un projet ; ils doivent être distingués des financeurs, qui apportent de financement mais n'ont pas nécessairement une responsabilité intellectuelle.

Exemple
<sponsor>Centre national de la recherche scientifique</sponsor>
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq.limited"/>
</content>
Schéma Declaration
element sponsor
{
   att.global.attributes,
   att.canonical.attributes,
   att.datable.attributes,
   attribute calendar { list { teidata.pointer+ } }?,
   macro.phraseSeq.limited
}

<stage>

<stage> (indication scénique) contient tout type d'indication scénique à l'intérieur d'un texte ou fragment de texte écrit pour le théâtre. [3.13.2. Core Tags for Drama 3.13. Passages of Verse or Drama 7.2.4. Stage Directions]
Modulecore
Attributs
typeindique le type d'indication scénique
Statut Recommendé
Type de données 0–∞ occurrences de teidata.enumerated séparé par un espace
Les valeurs suggérées comprennent:
setting
décrit une mise en scène
entrance
décrit une entrée
exit
décrit une sortie
business
décrit une action sur scène
novelistic
texte explicatif de la direction de scène.
delivery
décrit la façon dont parle un personnage
modifier
donne certains détails à propos d'un personnage
location
décrit un lieu
mixed
plusieurs des indications précédentes
Membre du
Contenu dans
Peut contenir
Note

The who attribute may be used to indicate more precisely the person or persons participating in the action described by the stage direction.

Exemple
<stage type="setting">La scène est dans une place de ville.</stage>
<stage type="exit">, s'en allant.</stage>
<stage type="business">(Arnolphe ôte par trois fois le chapeau de dessus la tête d'Alain.)</stage>
<stage type="delivery">, à <name>Georgette</name>.</stage>
<stage type="setting">(Tous étant rentrés.)</stage>
<stage type="delivery">, riant.</stage>
<stage type="delivery">, lui montrant le logis d'<name>AGNÈS</name>.</stage>
<stage type="delivery">, à part.</stage>
<stage type="business">(Frappant à la porte.)</stage>
<stage type="delivery">, assis.</stage>
<stage type="business">(Il se lève.)</stage>
Modèle de contenu
<content>
 <macroRef key="macro.specialPara"/>
</content>
Schéma Declaration
element stage
{
   att.ascribed.directed.attributes,
   att.global.attributes,
   att.placement.attributes,
   att.written.attributes,
   att.cmc.attributes,
   attribute type
   {
      list
      {
         (
            "setting"
          | "entrance"
          | "exit"
          | "business"
          | "novelistic"
          | "delivery"
          | "modifier"
          | "location"
          | "mixed"
          | teidata.enumerated
         )*
      }
   }?,
   macro.specialPara
}

<table>

<table> (tableau) contient du texte affiché sous forme de tableau, en rangées et colonnes. [15.1.1. TEI Tables]
Modulefigures
Attributs
rows(rows) indique le nombre de rangées dans le tableau.
Statut Optionel
Type de données teidata.count
Note

Les rangées sont ordonnées de haut en bas

cols(colonnes) indique le nombre de colonnes dans chaque rangée du tableau.
Statut Optionel
Type de données teidata.count
Note

Si aucun nombre n'est fourni, une application doit calculer le nombre de colonnes.

Dans chaque rangée, les colonnes sont ordonnées de gauche à droite.

Membre du
Contenu dans
Peut contenir
Note

Contient un titre facultatif et une suite de rangées.

Toute information relative à la restitution sera exprimée avec l'attribut global rend appliqué au tableau, à la rangée, ou à la cellule selon le cas.

Exemple
<table rows="4cols="4">
 <head>Persistance de la neige dans les Alpes suisses (Denzler). </head>
 <row>
  <cell role="label">A l'altitude de</cell>
  <cell role="data">650 m.</cell>
  <cell role="data">1300m.</cell>
  <cell role="data">1950m.</cell>
  <cell role="data">2700m.</cell>
 </row>
 <row>
  <cell role="label">la neige reste</cell>
  <cell role="data">77 jours.</cell>
  <cell role="data"> 200 jours.</cell>
  <cell role="data"> 245 jours.</cell>
  <cell role="data"> 365 jours.</cell>
 </row>
</table>
Modèle de contenu
<content>
 <sequence>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.headLike"/>
   <classRef key="model.global"/>
  </alternate>
  <alternate>
   <sequence minOccurs="1"
    maxOccurs="unbounded">

    <elementRef key="row"/>
    <classRef key="model.global"
     minOccurs="0maxOccurs="unbounded"/>

   </sequence>
   <sequence minOccurs="1"
    maxOccurs="unbounded">

    <classRef key="model.graphicLike"/>
    <classRef key="model.global"
     minOccurs="0maxOccurs="unbounded"/>

   </sequence>
  </alternate>
  <sequence minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.divBottom"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element table
{
   att.global.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   attribute rows { teidata.count }?,
   attribute cols { teidata.count }?,
   (
      ( model.headLike | model.global )*,
      (
         ( ( row, model.global* )+ )
       | ( ( model.graphicLike, model.global* )+ )
      ),
      ( ( model.divBottom, model.global* )* )
   )
}

<taxonomy>

<taxonomy> (taxinomie) définit une typologie soit implicitement au moyen d’une référence bibliographique, soit explicitement au moyen d’une taxinomie structurée. [2.3.7. The Classification Declaration]
Moduleheader
Attributs
Contenu dans
Peut contenir
Note

Nested taxonomies are common in many fields, so the taxonomy element can be nested.

Exemple
<taxonomy xml:id="fr_tax.a">
 <category xml:id="fr_tax.a.a">
  <catDesc>littérature</catDesc>
 </category>
 <category xml:id="fr_tax.a.a.1">
  <catDesc>Drame bourgeois</catDesc>
 </category>
 <category xml:id="fr_tax.a.a.1.α">
  <catDesc>Comédie larmoyante</catDesc>
 </category>
 <category xml:id="fr_tax.a.b">
  <catDesc>Correspondance</catDesc>
 </category>
 <category xml:id="fr_tax.a.b.1.a">
  <catDesc>Dernières lettres</catDesc>
 </category>
 <category xml:id="fr_tax.a.c.">
  <catDesc>Littérature européenne -- 16e siècle</catDesc>
 </category>
 <category xml:id="fr_tax.a.c.1">
  <catDesc>Satire de la Renaissance </catDesc>
 </category>
 <category xml:id="fr_tax.a.d">
  <catDesc>Récits de voyage</catDesc>
 </category>
 <category xml:id="fr_tax.a.d.1">
  <catDesc>Récits de la mer </catDesc>
 </category>
</taxonomy>
<bibl>indexation selon le système d'indexation RAMEAU, géré par la Bibliothèque nationale de
France</bibl>
Modèle de contenu
<content>
 <alternate>
  <alternate>
   <alternate minOccurs="1"
    maxOccurs="unbounded">

    <elementRef key="category"/>
    <elementRef key="taxonomy"/>
   </alternate>
   <sequence>
    <alternate minOccurs="1"
     maxOccurs="unbounded">

     <classRef key="model.descLike"
      minOccurs="1maxOccurs="1"/>

     <elementRef key="equivminOccurs="1"
      maxOccurs="1"/>

     <elementRef key="glossminOccurs="1"
      maxOccurs="1"/>

    </alternate>
    <alternate minOccurs="0"
     maxOccurs="unbounded">

     <elementRef key="category"/>
     <elementRef key="taxonomy"/>
    </alternate>
   </sequence>
  </alternate>
  <sequence>
   <classRef key="model.biblLike"/>
   <alternate minOccurs="0"
    maxOccurs="unbounded">

    <elementRef key="category"/>
    <elementRef key="taxonomy"/>
   </alternate>
  </sequence>
 </alternate>
</content>
Schéma Declaration
element taxonomy
{
   att.global.attributes,
   (
      (
         ( category | taxonomy )+
       | ( ( model.descLike | equiv | gloss )+, ( category | taxonomy )* )
      )
    | ( model.biblLike, ( category | taxonomy )* )
   )
}

<TEI>

<TEI> (document TEI) contient un seul document conforme à la TEI, qui comprend un en-tête TEI et un texte, soit de façon isolée, soit comme partie d’un élément teiCorpus. [4. Default Text Structure 16.1. Varieties of Composite Text]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: teiCorpus
textstructure: TEI
Peut contenir
header: teiHeader
textstructure: TEI text
Note

Cet élément est obligatoire.

Exemple
<TEI version="3.3.0" xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
  <fileDesc>
   <titleStmt>
    <title>Le document TEI le plus court possible.</title>
   </titleStmt>
   <publicationStmt>
    <p>D'abord publié comme faisant partie de la TEI P2.</p>
   </publicationStmt>
   <sourceDesc>
    <p>Aucune source : il s'agit d'un document original.</p>
   </sourceDesc>
  </fileDesc>
 </teiHeader>
 <text>
  <body>
   <p>A peu pres, le document TEI le plus court envisageable.</p>
  </body>
 </text>
</TEI>
Schematron

<sch:ns prefix="tei"
 uri="http://www.tei-c.org/ns/1.0"/>

<sch:ns prefix="xs"
 uri="http://www.w3.org/2001/XMLSchema"/>
Schematron

<sch:ns prefix="rng"
 uri="http://relaxng.org/ns/structure/1.0"/>

<sch:ns prefix="rna"
 uri="http://relaxng.org/ns/compatibility/annotations/1.0"/>
Schematron

<sch:ns prefix="sch"
 uri="http://purl.oclc.org/dsdl/schematron"/>

<sch:ns prefix="sch1x"
 uri="http://www.ascc.net/xml/schematron"/>
Modèle de contenu
<content>
 <sequence minOccurs="1maxOccurs="1">
  <elementRef key="teiHeader"/>
  <alternate minOccurs="1maxOccurs="1">
   <sequence minOccurs="1maxOccurs="1">
    <classRef key="model.resource"
     minOccurs="1maxOccurs="unbounded"/>

    <elementRef key="TEIminOccurs="0"
     maxOccurs="unbounded"/>

   </sequence>
   <elementRef key="TEIminOccurs="1"
    maxOccurs="unbounded"/>

  </alternate>
 </sequence>
</content>
Schéma Declaration
element TEI
{
   att.global.attributes,
   att.typed.attributes,
   ( teiHeader, ( ( model.resource+, TEI* ) | TEI+ ) )
}

<teiCorpus>

<teiCorpus> (TEI corpus) contient la totalité d'un corpus encodé selon la TEI, comprenant un seul en-tête de corpus et un ou plusieurs éléments TEI dont chacun contient un seul en-tête textuel et un texte. [4. Default Text Structure 16.1. Varieties of Composite Text]
Modulecore
Attributs
version(version) la version du modèle TEI
Statut Optionel
Type de données teidata.version
Membre du
Contenu dans
core: teiCorpus
Peut contenir
core: teiCorpus
header: teiHeader
textstructure: TEI text
Note

Cet élément doit contenir un en-tête TEI pour le corpus, et une suite d'éléments TEI, correspondant à autant de textes.

Cet élément est obligatoire quand il est applicable.

Exemple
<teiCorpus version="3.3.0" xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!--[en-tête du corpus]-->
 </teiHeader>
 <TEI>
  <teiHeader>
<!--[en-tête du premier texte]-->
  </teiHeader>
  <text>
<!--[premier texte du corpus]-->
  </text>
 </TEI>
 <TEI>
  <teiHeader>
<!--[en-tête du deuxième texte]-->
  </teiHeader>
  <text>
<!--[deuxième texte du corpus]-->
  </text>
 </TEI>
</teiCorpus>
Modèle de contenu
<content>
 <sequence>
  <elementRef key="teiHeader"/>
  <classRef key="model.resource"
   minOccurs="0maxOccurs="unbounded"/>

  <classRef key="model.describedResource"
   minOccurs="1maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element teiCorpus
{
   att.global.attributes,
   att.typed.attributes,
   attribute version { teidata.version }?,
   ( teiHeader, model.resource*, model.describedResource+ )
}

<teiHeader>

<teiHeader> (en-tête TEI) fournit des informations descriptives et déclaratives qui constituent une page de titre électronique au début de tout texte conforme à la TEI. [2.1.1. The TEI Header and Its Components 16.1. Varieties of Composite Text]
Moduleheader
Attributs
Contenu dans
core: teiCorpus
textstructure: TEI
Peut contenir
Note

Un des seuls éléments obligatoires dans tout document TEI.

Exemple
<teiHeader>
 <fileDesc>
  <titleStmt>
   <title>La Parisienne</title>
   <author>Henry BECQUE</author>
  </titleStmt>
  <publicationStmt>
   <distributor>ATILF (Analyse et Traitement Informatique de la Langue Française)</distributor>
   <idno type="FRANTEXT">L434</idno>
   <address>
    <addrLine>44, avenue de la Libération</addrLine>
    <addrLine>BP 30687</addrLine>
    <addrLine>54063 Nancy Cedex</addrLine>
    <addrLine>FRANCE</addrLine>
   </address>
   <availability status="free">
    <p>Dans un cadre de recherche ou d'enseignement</p>
   </availability>
  </publicationStmt>
  <sourceDesc>
   <biblStruct>
    <monogr>
     <imprint>
      <publisher>Paris : Fasquelle, 1922.</publisher>
     </imprint>
    </monogr>
   </biblStruct>
  </sourceDesc>
 </fileDesc>
 <profileDesc>
  <creation>
   <date>1885</date>
  </creation>
 </profileDesc>
</teiHeader>
Modèle de contenu
<content>
 <sequence>
  <elementRef key="fileDesc"/>
  <classRef key="model.teiHeaderPart"
   minOccurs="0maxOccurs="unbounded"/>

  <elementRef key="revisionDesc"
   minOccurs="0"/>

 </sequence>
</content>
Schéma Declaration
element teiHeader
{
   att.global.attributes,
   ( fileDesc, model.teiHeaderPart*, revisionDesc? )
}

<term>

<term> (terme) contient un mot simple, un mot composé ou un symbole, qui est considéré comme un terme technique. [3.4.1. Terms and Glosses]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Note

When this element appears within an index element, it is understood to supply the form under which an index entry is to be made for that location. Elsewhere, it is understood simply to indicate that its content is to be regarded as a technical or specialised term. It may be associated with a gloss element by means of its ref attribute; alternatively a gloss element may point to a term element by means of its target attribute.

In formal terminological work, there is frequently discussion over whether terms must be atomic or may include multi-word lexical items, symbolic designations, or phraseological units. The term element may be used to mark any of these. No position is taken on the philosophical issue of what a term can be; the looser definition simply allows the term element to be used by practitioners of any persuasion.

As with other members of the att.canonical class, instances of this element occuring in a text may be associated with a canonical definition, either by means of a URI (using the ref attribute), or by means of some system-specific code value (using the key attribute). Because the mutually exclusive target and cRef attributes overlap with the function of the ref attribute, they are deprecated and may be removed at a subsequent release.

Exemple
<p>SGANARELLE.</p>
<p>Qui est causée par l'âcreté des <term>humeurs</term> engendrées dans la concavité du
<term>diaphragme</term>, il arrive que ces <term>vapeurs</term>... Ossabandus, nequeys,
nequer, potarinum, quipsa milus. Voilà justement ce qui fait que votre fille est muette.</p>
Exemple
D'après la
théorie d'Austin, les<term> verbes performatifs</term> seraient ceux qui non seulement
décrivent l'action de celui qui les utilise, mais aussi, et en même temps, qui impliqueraient
cette action elle-même.
Modèle de contenu
<content>
 <macroRef key="macro.phraseSeq"/>
</content>
Schéma Declaration
element term
{
   att.global.attributes,
   att.declaring.attributes,
   att.pointing.attributes,
   att.typed.attributes,
   att.canonical.attributes,
   att.sortable.attributes,
   att.cReferencing.attributes,
   att.cmc.attributes,
   macro.phraseSeq
}

<text>

<text> (texte) contient un seul texte quelconque, simple ou composite, par exemple un poème ou une pièce de théâtre, un recueil d’essais, un roman, un dictionnaire ou un échantillon de corpus. [4. Default Text Structure 16.1. Varieties of Composite Text]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: teiCorpus
textstructure: TEI group
Peut contenir
analysis: interp interpGrp
figures: figure
linking: anchor
textstructure: back body front group
Note

Cet élément ne devrait pas être utilisé pour encoder un texte inséré à un endroit non prévisible à l'intérieur de la structure d'un autre texte, comme par exemple dans un récit qui est enchâssé ou cité dans un autre ; c'est l'élément <floatingText> qui doit être utilisé à cet effet.

Exemple
<text>
 <front>
  <docTitle>
   <titlePart>Souvenir de la nuit du 4</titlePart>
  </docTitle>
 </front>
 <body>
  <l>Il avait dans sa poche une toupie en buis.</l>
 </body>
</text>
Exemple

Le body d'un texte peut être remplacé par un groupe de textes enchâssés, comme dans la structure suivante :

<TEI xmlns="http://www.tei-c.org/ns/1.0">
 <teiHeader>
<!--[ en-tête du texte composite ]-->
 </teiHeader>
 <text>
  <front>
<!--[ partie préfatoire du texte composite ]-->
  </front>
  <group>
   <text>
    <front>
<!--[ partie préfatoire du premier texte ]-->
    </front>
    <body>
<!--[ corps du premier texte ]-->
    </body>
    <back>
<!--[ annexe du premier texte ]-->
    </back>
   </text>
   <text>
    <front>
<!--[ partie préfatoire du deuxième texte ]-->
    </front>
    <body>
<!--[ corps du deuxième texte ]-->
    </body>
    <back>
<!--[ annex du deuxième texte ]-->
    </back>
   </text>
<!--[ encore de textes, simples ou composites ]-->
  </group>
  <back>
<!--[ annex du texte composite ]-->
  </back>
 </text>
</TEI>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="0">
   <elementRef key="front"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
  <alternate>
   <elementRef key="body"/>
   <elementRef key="group"/>
  </alternate>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <sequence minOccurs="0">
   <elementRef key="back"/>
   <classRef key="model.global"
    minOccurs="0maxOccurs="unbounded"/>

  </sequence>
 </sequence>
</content>
Schéma Declaration
element text
{
   att.global.attributes,
   att.declaring.attributes,
   att.typed.attributes,
   att.written.attributes,
   (
      model.global*,
      ( ( front, model.global* )? ),
      ( body | group ),
      model.global*,
      ( ( back, model.global* )? )
   )
}

<textClass>

<textClass> (classification du texte) regroupe des informations décrivant la nature ou le sujet d’un texte selon des termes issus d’un système de classification standardisé, d’un thésaurus, etc. [2.4.3. The Text Classification]
Moduleheader
Attributs
Membre du
Contenu dans
header: profileDesc
Peut contenir
Exemple
<textClass>
 <keywords scheme="#fr_RAMEAU">
  <list>
   <item>Littérature française -- 20ème siècle -- Histoire et critique</item>
   <item>Littérature française -- Histoire et critique -- Théorie, etc.</item>
   <item>Français (langue) -- Style -- Bases de données.</item>
  </list>
 </keywords>
</textClass>
Exemple
<textClass>
 <catRef target="#fr_forme_prose"/>
</textClass>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <elementRef key="classCode"/>
  <elementRef key="catRef"/>
  <elementRef key="keywords"/>
 </alternate>
</content>
Schéma Declaration
element textClass
{
   att.global.attributes,
   att.declarable.attributes,
   ( classCode | catRef | keywords )*
}

<time>

<time> (temps) contient une expression qui précise un moment de la journée sous n'importe quelle forme. [3.6.4. Dates and Times]
Modulecore
Attributs
Membre du
Contenu dans
Peut contenir
Exemple
Bonsoir, il est <time when="00:00:00">minuit</time> ici, l'heure de dormir, et chez vous
à Paris, il est seulement <time when="07:00:00">7 h.</time> Je te
rapporterai plein de souvenirs pour te faire partager cette
expérience unique.
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element time
{
   att.global.attributes,
   att.datable.attributes,
   att.calendarSystem.attributes,
   att.canonical.attributes,
   att.editLike.attributes,
   att.dimensions.attributes,
   att.typed.attributes,
   att.cmc.attributes,
   ( text | model.gLike | model.phrase | model.global )*
}

<title>

<title> (titre) contient le titre complet d'une oeuvre quelconque [3.12.2.2. Titles, Authors, and Editors 2.2.1. The Title Statement 2.2.5. The Series Statement]
Modulecore
Attributs
typecaractérise le titre selon une typologie adaptée.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

Cet attribut est utile pour analyser les titres et les traiter en fonction de leur type ; lorsqu'un tel traitement spécifique n'est pas nécessaire, il n'est pas utile de donner une telle analyse, et le titre entier, sous-titres et titres parallèles inclus, peuvent être encodés dans un élément title.

calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Deprecatedwill be removed on 2024-11-11
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
levelindique le niveau bibliographique d'un titre, c'est-à-dire si ce titre identifie un article, un livre, une revue, une collection, ou un document non publié
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
a
(analytique) titre analytique (article, poème ou autre, publié comme partie d'un ensemble plus grand)
m
(monographique) titre de monographie (livre, ensemble ou autre, publié comme un document distinct, y compris les volumes isolés d'ouvrages en plusieurs volumes)
j
(journal) titre de revue
s
(série) titre de publication en série
u
(unpublished) titre de matéria non publié (thèses et dissertations comprises, à l'exception de leurs éditions commerciales)
Note

Si le titre apparaît comme fils de l'élément <analytic>, l'attribut level, s'il est renseigné, doit avoir la valeur ‘a’ ; si le titre apparaît comme fils de l'élément <monogr>, l'attribut level doit avoir la valeur ‘m’, ‘j’ ou ‘u’ ; si le titre apparaît comme fils de l'élément <series>, l'attribut level doit avoir la valeur ‘s’. Si le titre apparaît dans l'élément <msItem>, l'attribut level ne doit pas être utilisé.

Membre du
Contenu dans
Peut contenir
Note

Les attributs key et ref, hérités de la classe att.canonical sont utilisés pour indiquer la forme canonique du titre ; le premier donne (par exemple) l’identifiant d’un enregistrement dans un système externe de bibliothèque ; le second pointe vers un élément XML contenant la forme canonique du titre.

Exemple
<title>La vie mode d'emploi. Romans.</title>
Exemple
<title>Analyser les textes de communication</title>
Exemple
<title>Mélanges de linguistique française et de philologie et littérature médiévales
offerts à Monsieur Paul Imbs.</title>
Exemple
<title>Les fleurs du Mal de Charles Baudelaire : une édition électronique</title>
Exemple
<p>quand il rentre de ses chantiers de maçonnerie il dit rien, il pose son cul sur une
chaise, toujours au même endroit, et il lit <title>l'Humanité.</title>
</p>
Exemple
<title type="full">
 <title type="main">Synthèse</title>
 <title type="sub">an international journal for
   epistemology, methodology and history of
   science</title>
</title>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element title
{
   att.global.attributes,
   att.typed.attribute.subtype,
   att.canonical.attributes,
   att.datable.attributes,
   att.cmc.attributes,
   attribute type { teidata.enumerated }?,
   attribute calendar { list { teidata.pointer+ } }?,
   attribute level { "a" | "m" | "j" | "s" | "u" }?,
   macro.paraContent
}

<titlePage>

<titlePage> (page de titre) contient la page de titre d’un texte qui figure dans les parties liminaires. [4.6. Title Pages]
Moduletextstructure
Attributs
typeclasse la page de titre selon la typologie appropriée.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Note

Cet attribut est utile parce que c'est le même élément titlePage qui est utilisé pour les pages de titre de volumes, de collections, etc., et pour la page de titre ‘principale’ d'un ouvrage.

Membre du
Contenu dans
textstructure: back front
Peut contenir
Exemple
<titlePage>
 <docTitle>
  <titlePart type="main"> Histoire du Roi de Bohême</titlePart>
  <titlePart type="sub"> et de ses sept châteaux </titlePart>
 </docTitle>
 <titlePart>Pastiche.</titlePart>
 <byline>Par <docAuthor>Charles Nodier</docAuthor>
 </byline>
 <epigraph>
  <q>O imitatores, servum pecus! </q>
  <bibl>Horat., Epist. I. XIX, 19.</bibl>
 </epigraph>
 <docImprint>
  <name>PARIS</name>, <name>Delangle Frères</name> Éditeurs-libraires,
 <name>Place de la Bourse</name>
 </docImprint>
 <docDate>MDCCCXXX</docDate>
</titlePage>
Modèle de contenu
<content>
 <sequence>
  <classRef key="model.global"
   minOccurs="0maxOccurs="unbounded"/>

  <classRef key="model.titlepagePart"/>
  <alternate minOccurs="0"
   maxOccurs="unbounded">

   <classRef key="model.titlepagePart"/>
   <classRef key="model.global"/>
  </alternate>
 </sequence>
</content>
Schéma Declaration
element titlePage
{
   att.global.attributes,
   att.typed.attribute.subtype,
   attribute type { teidata.enumerated }?,
   (
      model.global*,
      model.titlepagePart,
      ( model.titlepagePart | model.global )*
   )
}

<titlePart>

<titlePart> (title part) contient une section ou division du titre d’un ouvrage telle qu’elle est indiquée sur la page de titre. [4.6. Title Pages]
Moduletextstructure
Attributs
type(type) précise le rôle de cette subdivision du titre.
Dérivé deatt.typed
Statut Optionel
Type de données teidata.enumerated
Valeur par défaut main
Membre du
Contenu dans
textstructure: back docTitle front titlePage
Peut contenir
Exemple
<docTitle>
 <titlePart type="main">Cinq semaines en ballon.</titlePart>
 <titlePart type="desc">Voyage de découvertes en Afrique par 3 anglais.</titlePart>
</docTitle>
Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element titlePart
{
   att.global.attributes,
   att.typed.attribute.subtype,
   attribute type { teidata.enumerated }?,
   macro.paraContent
}

<titleStmt>

<titleStmt> (mention de titre) regroupe les informations sur le titre d’une œuvre et les personnes ou institutions responsables de son contenu intellectuel. [2.2.1. The Title Statement 2.2. The File Description]
Moduleheader
Attributs
Contenu dans
header: fileDesc
Peut contenir
Exemple
<titleStmt>
 <title>Le sanctoral du lectionnaire de l'office dominicain (1254-1256)</title>
 <funder>2008—..., École nationale des chartes</funder>
 <principal>Anne-Élisabeth Urfels-Capot</principal>
 <respStmt>
  <resp>responsable des publications</resp>
  <name>Olivier Canteaut (École nationale des chartes)</name>
 </respStmt>
 <respStmt>
  <resp> 2009—..., Éditeur électronique : du TEI à l'écran</resp>
  <name ref="vincent.jolivet@enc.sorbonne.fr">Vincent Jolivet (École nationale
     des chartes)</name>
 </respStmt>
 <respStmt>
  <resp>2009, Éditeur scientifique</resp>
  <name ref="pascale.bourgain@enc.sorbonne.fr">Pascale Bourgain (École
     nationale des chartes)</name>
 </respStmt>
 <respStmt>
  <resp>2008, Conversion du document bureautique vers TEI</resp>
  <name ref="frederic.glorieux@enc.sorbonne.fr">Frédéric Glorieux (École
     nationale des chartes)</name>
 </respStmt>
</titleStmt>
Modèle de contenu
<content>
 <sequence>
  <elementRef key="titleminOccurs="1"
   maxOccurs="unbounded"/>

  <classRef key="model.respLike"
   minOccurs="0maxOccurs="unbounded"/>

 </sequence>
</content>
Schéma Declaration
element titleStmt { att.global.attributes, ( title+, model.respLike* ) }

<trailer>

<trailer> contient un titre de fin ou de bas de page à la fin d’une division du texte. [4.2.4. Content of Textual Divisions 4.2. Elements Common to All Divisions]
Moduletextstructure
Attributs
Membre du
Contenu dans
core: lg list
figures: figure table
Peut contenir
Exemple
<trailer>Explicit pars tertia</trailer>
Exemple
<trailer>Explicit pars tertia</trailer>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <elementRef key="lg"/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.inter"/>
  <classRef key="model.lLike"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Schéma Declaration
element trailer
{
   att.global.attributes,
   att.typed.attributes,
   att.placement.attributes,
   att.written.attributes,
   att.cmc.attributes,
   (
      text
    | lgmodel.gLikemodel.phrasemodel.intermodel.lLikemodel.global
   )*
}

<unclear>

<unclear> (incertain) contient un mot, une expression ou bien un passage qui ne peut être transcrit avec certitude parce qu'il est illisible ou inaudible dans la source. [12.3.3.1. Damage, Illegibility, and Supplied Text 3.5.3. Additions, Deletions, and Omissions]
Modulecore
Attributs
reasonindique pourquoi il est difficile de transcrire le document
Statut Optionel
Type de données 1–∞ occurrences de teidata.enumerated séparé par un espace
Les valeurs suggérées comprennent:
illegible
(illisible)
inaudible
(inaudible)
faded
(faded)
background_noise
(background noise)
eccentric_ductus
(eccentric ductus) indicates illegibility due to an unusual, awkward, or incompetent execution of a glyph or glyphs
<div>
 <head>Rx</head>
 <p>500 mg <unclear reason="illegible">placebo</unclear>
 </p>
</div>
agentlorsque la difficulté de transcription vient d'un dommage, catégorise la cause du dommage si celle-ci peut être identifiée
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
rubbing
des dommages résultent du frottement des bords de la feuille
mildew
des dégâts résultent de la moisissure sur la surface de la feuille
smoke
des dégâts résultent de la fumée
Membre du
Contenu dans
Peut contenir
Note

Le même élément est utilisé pour tous les cas d'incertitude portant sur la transcription du contenu d'éléments, qu'il s'agisse de documents écrits ou oraux. Pour les autres aspects concernant la certitude, l'incertitude, et la fiabilité du balisage et de la transcription, voir le chapitre 22. Certainty, Precision, and Responsibility.

Les éléments <damage>, gap, del, unclear et <supplied> peuvent être utilisés en étroite conjonction. Voir la section pour plus de détails sur l'élément le plus pertinent en fonction des circonstances.

Exemple
<add place="inspace">Envoyez-moi une épreuve <unclear cert="medium">W</unclear>
 <gap reason="inDéchiffrable"/>
</add>
Exemple
and from time to time invited in like manner
his att<unclear>ention</unclear>

Dans ce cas, les lettres à la fin du mot sont difficiles à lire.

Modèle de contenu
<content>
 <macroRef key="macro.paraContent"/>
</content>
Schéma Declaration
element unclear
{
   att.global.attributes,
   att.editLike.attributes,
   att.dimensions.attributes,
   att.cmc.attributes,
   attribute reason
   {
      list
      {
         (
            "illegible"
          | "inaudible"
          | "faded"
          | "background_noise"
          | "eccentric_ductus"
          | teidata.enumerated
         )+
      }
   }?,
   attribute agent { teidata.enumerated }?,
   macro.paraContent
}

<val>

<val> (valeur) contient une seule valeur d'attribut. [23. Documentation Elements 23.5.3. Attribute List Specification]
Moduletagdocs
Attributs
Membre du
Contenu dans
Peut contenirDes données textuelles uniquement
Exemple
<val>inconnu</val>
Modèle de contenu
<content>
 <textNode/>
</content>
Schéma Declaration
element val { att.global.attributes, text }

<w>

<w> (mot) représente un mot grammatical (pas nécessairement orthographique) [18.1. Linguistic Segment Categories 18.4.2. Lightweight Linguistic Annotation]
Moduleanalysis
Attributs
Membre du
Contenu dans
Peut contenir
analysis: interp interpGrp pc w
figures: figure
linking: anchor seg
des données textuelles
Exemple

This example is adapted from the Folger Library’s Early Modern English Drama version of The Wits: a Comedy by William Davenant.

<l>
 <w lemma="itpos="pn"
  xml:id="A19883-003-a-0100">
IT</w>
 <w lemma="havepos="vvz"
  xml:id="A19883-003-a-0110">
hath</w>
 <w lemma="bepos="vvn"
  xml:id="A19883-003-a-0120">
been</w>
 <w lemma="saypos="vvn"
  xml:id="A19883-003-a-0130">
said</w>
 <w lemma="ofpos="acp-p"
  xml:id="A19883-003-a-0140">
of</w>
 <w lemma="oldpos="j"
  xml:id="A19883-003-a-0150">
old</w>
 <pc xml:id="A19883-003-a-0160">,</pc>
 <w lemma="thatpos="cs"
  xml:id="A19883-003-a-0170">
that</w>
 <w lemma="playpos="vvz"
  xml:id="A19883-003-a-0180">

  <choice>
   <orig>Playes</orig>
   <reg>Plays</reg>
  </choice>
 </w>
 <w lemma="bepos="vvb"
  xml:id="A19883-003-a-0190">
are</w>
 <w lemma="feastpos="n2"
  xml:id="A19883-003-a-0200">
Feasts</w>
 <pc xml:id="A19883-003-a-0210">,</pc>
</l>
<l xml:id="A19883-e100220">
 <w lemma="poetpos="n2"
  xml:id="A19883-003-a-0220">
Poets</w>
 <w lemma="thepos="d"
  xml:id="A19883-003-a-0230">
the</w>
 <w lemma="cookpos="n2"
  xml:id="A19883-003-a-0240">

  <choice>
   <orig>Cookes</orig>
   <reg>Cooks</reg>
  </choice>
 </w>
 <pc xml:id="A19883-003-a-0250">,</pc>
 <w lemma="andpos="cc"
  xml:id="A19883-003-a-0260">
and</w>
 <w lemma="thepos="d"
  xml:id="A19883-003-a-0270">
the</w>
 <w lemma="spectatorpos="n2"
  xml:id="A19883-003-a-0280">
Spectators</w>
 <w lemma="guestpos="n2"
  xml:id="A19883-003-a-0290">
Guests</w>
 <pc xml:id="A19883-003-a-0300">,</pc>
</l>
<l xml:id="A19883-e100230">
 <w lemma="thepos="d"
  xml:id="A19883-003-a-0310">
The</w>
 <w lemma="actorpos="n2"
  xml:id="A19883-003-a-0320">
Actors</w>
 <w lemma="waiterpos="n2"
  xml:id="A19883-003-a-0330">
Waiters</w>
 <pc xml:id="A19883-003-a-0340">:</pc>
<!-- ... -->
</l>
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <elementRef key="seg"/>
  <elementRef key="w"/>
  <elementRef key="m"/>
  <elementRef key="c"/>
  <elementRef key="pc"/>
  <classRef key="model.global"/>
  <classRef key="model.lPart"/>
  <classRef key="model.hiLike"/>
  <classRef key="model.pPart.edit"/>
 </alternate>
</content>
Schéma Declaration
element w
{
   att.global.attributes,
   att.segLike.attributes,
   att.typed.attributes,
   att.linguistic.attributes,
   att.notated.attributes,
   att.cmc.attributes,
   (
      text
    | model.gLikesegw
    | m
    | c
    | pcmodel.globalmodel.lPartmodel.hiLikemodel.pPart.edit
   )*
}

Schema tei_lite: Model classes

model.addressLike

model.addressLike regroupe des éléments employés pour représenter des adresses postales ou électroniques. [1. The TEI Infrastructure]
Moduletei
Utilisé par
Membresaddress

model.addrPart

model.addrPart regroupe des éléments comme des noms ou des codes postaux qui peuvent apparaître dans une adresse postale [3.6.2. Addresses]
Moduletei
Utilisé par
Membresmodel.nameLike [model.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs] addrLine

model.attributable

model.attributable groups elements that contain a word or phrase that can be attributed to a source. [3.3.3. Quotation 4.3.2. Floating Texts]
Moduletei
Utilisé par
Membresmodel.quoteLike [cit]

model.availabilityPart

model.availabilityPart regroupe des éléments tels que les licences ou les paragraphes indiquant la disponibilité d'un ouvrage. [2.2.4. Publication, Distribution, Licensing, etc.]
Moduletei
Utilisé par
Membreslicence

model.biblLike

model.biblLike regroupe des éléments contenant une description bibliographique. [3.12. Bibliographic Citations and References]
Moduletei
Utilisé par
Membresbibl listBibl

model.biblPart

model.biblPart regroupe des éléments qui sont des composantes d’une description bibliographique. [3.12. Bibliographic Citations and References]
Moduletei
Utilisé par
Membresmodel.imprintPart [biblScope distributor pubPlace publisher] model.respLike [author editor funder principal respStmt sponsor] availability bibl edition extent relatedItem

model.choicePart

model.choicePart regroupe des éléments (autres que choice) qui peuvent être utilisés en alternance avec choice [3.5. Simple Editorial Changes]
Moduletei
Utilisé par
Membresabbr corr expan orig reg seg sic unclear

model.common

model.common regroupe des éléments de niveau fragment - et des éléments de niveau intermédiaire. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.cmc model.divPart [model.lLike [l] model.pLike [p] lg sp] model.inter [model.attributable [model.quoteLike [cit] ] model.biblLike [bibl listBibl] model.egLike [eg] model.labelLike [desc label] model.listLike [list table] model.oddDecl model.stageLike [stage] ] q
Note

Cette classe définit l'ensemble des éléments de niveau fragment et de niveau intermédiaire ; de nombreux modèles de contenu y font appel, y compris ceux qui sont relatifs aux divisions textuelles.

model.dateLike

model.dateLike regroupe des éléments contenant des expressions relatives au temps. [3.6.4. Dates and Times 14.4. Dates]
Moduletei
Utilisé par
Membresdate time

model.descLike

model.descLike regroupe des éléments qui contiennent une description de la fonction d'un élément.
Moduletei
Utilisé par
Membresdesc

model.describedResource

model.describedResource groups elements which contain the content of a digital resource and its metadata; these elements may serve as the outermost or ‘root’ element of a TEI-conformant document [1.3. The TEI Class System]
Moduletei
Utilisé par
MembresTEI teiCorpus

model.divBottom

model.divBottom regroupe des éléments placés à la fin d'une division de texte. [4.2. Elements Common to All Divisions]
Moduletei
Utilisé par
Membresmodel.divBottomPart [closer postscript signed trailer] model.divWrapper [argument byline dateline docAuthor docDate epigraph salute]

model.divBottomPart

model.divBottomPart regroupe des éléments qu'on ne peut trouver qu'à la fin d'une division de texte. [4.6. Title Pages]
Moduletei
Utilisé par
Membrescloser postscript signed trailer

model.divGenLike

model.divGenLike regroupe des éléments utilisés pour représenter une division structurelle qui est générée plutôt que présente de manière explicite dans la source
Moduletei
Utilisé par
MembresdivGen

model.divLike

model.divLike regroupe des éléments utilisés pour représenter des divisions structurelles génériques non numérotées.
Moduletei
Utilisé par
Membresdiv

model.divPart

model.divPart regroupe des éléments de niveau paragraphe apparaissant directement dans des divisions [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.lLike [l] model.pLike [p] lg sp
Note

Noter que cette classe d'éléments ne comprend pas les membres de la classe model.inter, qui peuvent apparaître soit à l'intérieur, soit entre des items de niveau paragraphe.

model.divTop

model.divTop regroupe des éléments apparaissant au début d'une division de texte. [4.2. Elements Common to All Divisions]
Moduletei
Utilisé par
Membresmodel.divTopPart [model.headLike [head] opener signed] model.divWrapper [argument byline dateline docAuthor docDate epigraph salute]

model.divTopPart

model.divTopPart regroupe des éléments qu'on ne trouve qu'au début d'une division de texte. [4.6. Title Pages]
Moduletei
Utilisé par
Membresmodel.headLike [head] opener signed

model.divWrapper

model.divWrapper regroupe des éléments qui peuvent être placés au début ou à la fin de n'importe quelle division de texte. [4.2. Elements Common to All Divisions]
Moduletei
Utilisé par
Membresargument byline dateline docAuthor docDate epigraph salute

model.egLike

model.egLike regroupe des éléments contenant des exemples ou des illustrations. [23.1.1. Phrase Level Terms]
Moduletei
Utilisé par
Membreseg

model.emphLike

model.emphLike regroupe des éléments qui sont distingués visuellement, et auxquels on peut attribuer une signification sémantique. [3.3. Highlighting and Quotation]
Moduletei
Utilisé par
Membrescode emph foreign gloss ident mentioned soCalled term title

model.encodingDescPart

model.encodingDescPart regroupe des éléments qui peuvent apparaître plusieurs fois dans l'élément encodingDesc.
Moduletei
Utilisé par
MembresclassDecl editorialDecl projectDesc refsDecl samplingDecl

model.frontPart

model.frontPart regroupe les éléments du niveau des divisions qui peuvent apparaître dans un front ou un back. [7.1. Front and Back Matter ]
Moduletei
Utilisé par
Membresmodel.frontPart.drama divGen listBibl titlePage

model.global

model.global regroupe des éléments qui peuvent apparaître à un point quelconque dans un texte TEI. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.global.edit [gap] model.global.meta [index interp interpGrp] model.milestoneLike [anchor lb milestone pb] model.noteLike [note] figure

model.global.edit

model.global.edit regroupe des éléments globalement disponibles qui exécutent une fonction spécifiquement éditoriale. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresgap

model.global.meta

model.global.meta regroupe des éléments disponibles globalement qui décrivent le statut d'autres éléments. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresindex interp interpGrp
Note

Les éléments de cette classe sont utilisés pour contenir des groupes de liens ou d'interprétations abstraites, ou pour fournir des indications quant à la certitude, etc. Il peut être commode de situer tous les éléments contenant des métadonnées, par exemple de les rassembler dans la même divison que les éléments auxquels ils sont reliés ; ou de les retrouver tous dans la division qui leur est propre. Ils peuvent cependant apparaître à un point quelconque d'un texte TEI.

model.graphicLike

model.graphicLike regroupe des éléments contenant des images, des formules et d'autres objets semblables. [3.10. Graphics and Other Non-textual Components]
Moduletei
Utilisé par
Membresformula graphic

model.headLike

model.headLike regroupe des éléments employés pour donner un titre ou un intitulé au début d'une division de texte
Moduletei
Utilisé par
Membreshead

model.highlighted

model.highlighted regroupe des éléments du niveau de l'expression qui sont typographiquement distincts. [3.3. Highlighting and Quotation]
Moduletei
Utilisé par
Membresmodel.emphLike [code emph foreign gloss ident mentioned soCalled term title] model.hiLike [hi q]

model.hiLike

model.hiLike regroupe des éléments du niveau de l’expression qui sont typographiquement distincts mais auxquels aucune fonction spécifique ne peut être attribuée. [3.3. Highlighting and Quotation]
Moduletei
Utilisé par
Membreshi q

model.imprintPart

model.imprintPart regoupe les éléments bibliographiques qui apparaissent à l'intérieur de documents imprimés. [3.12. Bibliographic Citations and References]
Moduletei
Utilisé par
MembresbiblScope distributor pubPlace publisher

model.inter

model.inter regroupe des éléments qui peuvent apparaître à l’intérieur ou entre des composants semblables au paragraphe. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.attributable [model.quoteLike [cit] ] model.biblLike [bibl listBibl] model.egLike [eg] model.labelLike [desc label] model.listLike [list table] model.oddDecl model.stageLike [stage]

model.labelLike

model.labelLike regroupe des éléments employés pour gloser ou expliquer d'autres parties d'un document.
Moduletei
Utilisé par
Membresdesc label

model.limitedPhrase

model.limitedPhrase regroupe des éléments du niveau de l'expression excluant ceux qui sont principalement destinés à la transcription des sources existantes. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.emphLike [code emph foreign gloss ident mentioned soCalled term title] model.hiLike [hi q] model.pPart.data [model.addressLike [address] model.dateLike [date time] model.measureLike [num] model.nameLike [model.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs] ] model.pPart.editorial [abbr choice expan] model.pPart.msdesc model.phrase.xml [att gi val] model.ptrLike [ptr ref]

model.listLike

model.listLike regroupe les éléments de type liste. [3.8. Lists]
Moduletei
Utilisé par
Membreslist table

model.lLike

model.lLike regroupe des éléments représentant des composants de la métrique comme des vers.
Moduletei
Utilisé par
Membresl

model.measureLike

model.measureLike regroupe des éléments qui indiquent un nombre, une quantité, une mesure ou un extrait d'un texte qui porte une signification numérique. [3.6.3. Numbers and Measures]
Moduletei
Utilisé par
Membresnum

model.milestoneLike

model.milestoneLike regroupe des éléments de type borne utilisés pour représenter des systèmes de référence [1.3. The TEI Class System 3.11.3. Milestone Elements]
Moduletei
Utilisé par
Membresanchor lb milestone pb

model.nameLike

model.nameLike regroupe des éléments qui nomment une personne, un lieu ou une organisation, ou qui y font référence à.
Moduletei
Utilisé par
Membresmodel.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs
Note

Un ensemble de niveau supérieur regroupant les éléments d'appellation qui peuvent apparaître dans les dates, les adresses, les mentions de responsabilité, etc.

model.nameLike.agent

model.nameLike.agent regroupe des éléments qui contiennent des noms d'individus ou de personnes morales. [3.6. Names, Numbers, Dates, Abbreviations, and Addresses]
Moduletei
Utilisé par
Membresname
Note

Cette classe est utilisée dans le modèle de contenu des éléments qui référencent des noms de personnes ou d'organisations.

model.noteLike

model.noteLike regroupe tous les éléments globaux de type note [3.9. Notes, Annotation, and Indexing]
Moduletei
Utilisé par
Membresnote

model.paraPart

model.paraPart groups elements that may appear in paragraphs and similar elements [3.1. Paragraphs]
Moduletei
Utilisé par
Membresmodel.gLike model.global [model.global.edit [gap] model.global.meta [index interp interpGrp] model.milestoneLike [anchor lb milestone pb] model.noteLike [note] figure] model.inter [model.attributable [model.quoteLike [cit] ] model.biblLike [bibl listBibl] model.egLike [eg] model.labelLike [desc label] model.listLike [list table] model.oddDecl model.stageLike [stage] ] model.lLike [l] model.phrase [model.graphicLike [formula graphic] model.highlighted [model.emphLike [code emph foreign gloss ident mentioned soCalled term title] model.hiLike [hi q] ] model.lPart model.pPart.data [model.addressLike [address] model.dateLike [date time] model.measureLike [num] model.nameLike [model.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs] ] model.pPart.edit [model.pPart.editorial [abbr choice expan] model.pPart.transcriptional [add corr del orig reg sic unclear] ] model.pPart.msdesc model.phrase.xml [att gi val] model.ptrLike [ptr ref] model.segLike [pc s seg w] model.specDescLike] lg

model.phrase

model.phrase regroupe des éléments qui apparaissent au niveau des mots isolés ou des groupes de mots. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membresmodel.graphicLike [formula graphic] model.highlighted [model.emphLike [code emph foreign gloss ident mentioned soCalled term title] model.hiLike [hi q] ] model.lPart model.pPart.data [model.addressLike [address] model.dateLike [date time] model.measureLike [num] model.nameLike [model.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs] ] model.pPart.edit [model.pPart.editorial [abbr choice expan] model.pPart.transcriptional [add corr del orig reg sic unclear] ] model.pPart.msdesc model.phrase.xml [att gi val] model.ptrLike [ptr ref] model.segLike [pc s seg w] model.specDescLike
Note

Cette classe d'éléments peut se trouver dans des paragraphes, des entrées de listes, des vers, etc.

model.phrase.xml

model.phrase.xml regroupe des éléments de niveau expression utilisés pour encoder des constructions XML telles que des noms d'éléments, des noms d'attributs ou des valeurs d'attributs [23. Documentation Elements]
Moduletei
Utilisé par
Membresatt gi val

model.placeStateLike

model.placeStateLike regroupe des éléments qui décrivent les transformations d'un lieu
Moduletei
Utilisé par
Membresmodel.placeNamePart

model.pLike

model.pLike regroupe des éléments de type paragraphe.
Moduletei
Utilisé par
Membresp

model.pLike.front

model.pLike.front regroupe des éléments de type paragraphe qui peuvent apparaître comme des constituants directs des parties liminaires. [4.6. Title Pages]
Moduletei
Utilisé par
Membresargument byline dateline docAuthor docDate docEdition docImprint docTitle epigraph head titlePart

model.pPart.data

model.pPart.data regroupe des éléments de niveau expression contenant des noms, des dates, des nombres, des mesures et d'autres données semblables [3.6. Names, Numbers, Dates, Abbreviations, and Addresses]
Moduletei
Utilisé par
Membresmodel.addressLike [address] model.dateLike [date time] model.measureLike [num] model.nameLike [model.nameLike.agent [name] model.offsetLike model.placeStateLike [model.placeNamePart] idno rs]

model.pPart.edit

model.pPart.edit regroupe des éléments de niveau expression, utilisés pour de simples interventions éditoriales de corrections et de transcriptions. [3.5. Simple Editorial Changes]
Moduletei
Utilisé par
Membresmodel.pPart.editorial [abbr choice expan] model.pPart.transcriptional [add corr del orig reg sic unclear]

model.pPart.editorial

model.pPart.editorial regroupe des éléments de niveau expression, utilisés pour de simples interventions éditoriales utiles dans la transcription comme dans la rédaction. [3.5. Simple Editorial Changes]
Moduletei
Utilisé par
Membresabbr choice expan

model.pPart.transcriptional

model.pPart.transcriptional regroupe des éléments de niveau expression, utilisés pour des transcriptions éditoriales de sources pré-existantes [3.5. Simple Editorial Changes]
Moduletei
Utilisé par
Membresadd corr del orig reg sic unclear

model.profileDescPart

model.profileDescPart regroupe des éléments que l'on peut utiliser plusieurs fois dans l'élément profileDesc.
Moduletei
Utilisé par
Membrescreation langUsage textClass

model.ptrLike

model.ptrLike regroupe des éléments utilisés pour localiser et faire référence à quelque chose. [3.7. Simple Links and Cross-References]
Moduletei
Utilisé par
Membresptr ref

model.publicationStmtPart.agency

model.publicationStmtPart.agency regroupe des éléments qui peuvent apparaître à l'intérieur de l'élément publicationStmt de l'En-tête TEI [2.2.4. Publication, Distribution, Licensing, etc.]
Moduletei
Utilisé par
Membresauthority distributor publisher

model.publicationStmtPart.detail

model.publicationStmtPart.detail regroupe des éléments qui peuvent apparaître à l'intérieur de l'élément publicationStmt de l'En-tête TEI [2.2.4. Publication, Distribution, Licensing, etc.]
Moduletei
Utilisé par
Membresmodel.ptrLike [ptr ref] address availability date idno pubPlace

model.quoteLike

model.quoteLike regroupe des éléments employés pour contenir directement des citations
Moduletei
Utilisé par
Membrescit

model.resource

model.resource regroupe des éléments non-textuels qui, avec un en-tête et un texte, constitue un document TEI. [1.3. The TEI Class System]
Moduletei
Utilisé par
Membrestext

model.respLike

model.respLike regroupe des éléments qui sont utilisés pour indiquer une responsabilité intellectuelle ou une autre responsabilité significative, par exemple dans un élément bibliographique.
Moduletei
Utilisé par
Membresauthor editor funder principal respStmt sponsor

model.segLike

model.segLike regroupe des éléments utilisés pour une segmentation arbitraire. [17.3. Blocks, Segments, and Anchors 18.1. Linguistic Segment Categories]
Moduletei
Utilisé par
Membrespc s seg w
Note

Les principes sur lesquels repose la segmentation, ainsi que tout code particulier ou valeur d'attribut utilisée, doivent être définis explicitement dans l'élément <segmentation> de l'élément encodingDesc situé dans l'En-tête TEI associé.

model.stageLike

model.stageLike regroupe des éléments contenant des indications scéniques ou des indications de même nature, définies par le module relatif aux textes de théâtre [7.3. Other Types of Performance Text]
Moduletei
Utilisé par
Membresstage
Note

Les indications scéniques appartiennent à la classe inter : cela signifie qu'elles peuvent apparaître à l'intérieur d'éléments de niveau composant ou bien entre ces éléments.

model.teiHeaderPart

model.teiHeaderPart regroupe des éléments de macrostructure qui peuvent apparaître plus d'une fois dans l’en-tête TEI.
Moduletei
Utilisé par
MembresencodingDesc profileDesc

model.titlepagePart

model.titlepagePart regroupe des éléments qui peuvent apparaître comme constituants directs d'une page de titre (docTitle, <docAuth>,docImprint ou epigraph) [4.6. Title Pages]
Moduletei
Utilisé par
Membresargument byline docAuthor docDate docEdition docImprint docTitle epigraph graphic imprimatur titlePart

Schema tei_lite: Attribute classes

att.anchoring

att.anchoring (anchoring) provides attributes for use on annotations, e.g. notes and groups of notes describing the existence and position of an anchor for annotations.
Moduletei
Membresnote
Attributs
anchored(anchored) indique si l'exemplaire du texte montre l'emplacement de référence exact pour la note
Statut Optionel
Type de données teidata.truthValue
Valeur par défaut true
Note

Dans des textes modernes, les notes sont habituellement ancrées au moyen d’appels de notes explicites (pour des notes de bas de page ou des notes de fin de texte). A la place, une indication explicite de l'expression ou de la ligne annotée peut cependant être employée (par exemple ‘page 218, lignes 3–4’). L'attribut anchored indique si un emplacement est donné explicitement ou s'il est exprimé par un symbole ou par un renvoi. La valeur true indique qu'un endroit explicite est indiqué dans le texte ; la valeur false indique que le texte n'indique pas un endroit spécifique d'attachement pour la note. Si des symboles spécifiques utilisés dans le texte à l'endroit où la note est ancrée doivent être enregistrés, l'attribut n sera utilisé.

targetEnd(target end) pointe vers la fin d'un passage auquel la note est attachée, si la note n'est pas enchâssée dans le texte à cet endroit
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

Cet attribut est conservé pour assurer un arrière-plan compatible ; il sera supprimé dans la prochaine mise à jour des Recommandations. La procédure recommandée pour pointer en direction d'une expansion des éléments est de le faire au moyen de la fonction range de XPointer, telle que la description en est faite à 17.2.4.6. range().

Exemple
<p>(...) tamen reuerendos dominos archiepiscopum et canonicos Leopolienses
necnon episcopum in duplicibus Quatuortemporibus<anchor xml:id="A55234"/> totaliter expediui...</p>
<!-- elsewhere in the document -->
<noteGrp targetEnd="#A55234">
 <note xml:lang="en"> Quatuor Tempora, so called dry fast days.
 </note>
 <note xml:lang="pl"> Quatuor Tempora, tzw. Suche dni postne.
 </note>
</noteGrp>

att.ascribed

att.ascribed fournit des attributs pour des éléments transcrivant la parole ou l'action qui peuvent être attribuées à un individu en particulier. [3.3.3. Quotation 8.3. Elements Unique to Spoken Texts]
Moduletei
Membresatt.ascribed.directed [q sp stage] change
Attributs
whoindique la personne ou le groupe de personnes à qui le contenu de l'élément est attribué.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace

In the following example from Hamlet, speeches (sp) in the body of the play are linked to <role> elements in the <castList> using the who attribute.

<castItem type="role">
 <role xml:id="Barnardo">Bernardo</role>
</castItem>
<castItem type="role">
 <role xml:id="Francisco">Francisco</role>
 <roleDesc>a soldier</roleDesc>
</castItem>
<!-- ... -->
<sp who="#Barnardo">
 <speaker>Bernardo</speaker>
 <l n="1">Who's there?</l>
</sp>
<sp who="#Francisco">
 <speaker>Francisco</speaker>
 <l n="2">Nay, answer me: stand, and unfold yourself.</l>
</sp>
Note

Pour un discours transcrit, identifiera typiquement un participant ou un groupe participant ; dans d'autres contextes, pointera vers n'importe quel élément <person> identifié.

att.ascribed.directed

att.ascribed.directed provides attributes for elements representing speech or action that can be directed at a group or individual. [3.3.3. Quotation 8.3. Elements Unique to Spoken Texts]
Moduletei
Membresq sp stage
Attributs
toWhomindicates the person, or group of people, to whom a speech act or action is directed.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace

In the following example from Mary Pix's The False Friend, speeches (sp) in the body of the play are linked to <castItem> elements in the <castList> using the toWhom attribute, which is used to specify who the speech is directed to. Additionally, the stage includes toWhom to indicate the directionality of the action.

<castItem type="role">
 <role xml:id="emil">Emilius.</role>
</castItem>
<castItem type="role">
 <role xml:id="lov">Lovisa</role>
</castItem>
<castItem type="role">
 <role xml:id="serv">A servant</role>
</castItem>
<!-- ... -->
<sp who="#emiltoWhom="#lov">
 <speaker>Emil.</speaker>
 <l n="1">My love!</l>
</sp>
<sp who="#lovtoWhom="#emil">
 <speaker>Lov.</speaker>
 <l n="2">I have no Witness of my Noble Birth</l>
 <stage who="emiltoWhom="#serv">Pointing to her Woman.</stage>
 <l>But that poor helpless wretch——</l>
</sp>

att.breaking

att.breaking fournit un attribut pour indiquer si un élément est consideré ou pas comme marquant la fin d'un mot orthographique, comme le fait une espace. [3.11.3. Milestone Elements]
Moduletei
Membreslb milestone pb
Attributs
breakindique si l'élément qui porte cet attribut peut être considéré comme une espace blanc indiquant la fin d'un mot orthographique.
Statut Recommendé
Type de données teidata.enumerated
Sample values include
yes
l'élément qui porte cet attribut peut être considéré comme indiquant la fin d'un mot orthographique
no
l'élément qui porte cet attribut ne peut être pas considéré comme indiquant la fin d'un mot orthographique
maybe
l'encodage ne prends aucune position sur la question.

In the following lines from the Dream of the Rood, linebreaks occur in the middle of the words lāðost and reord-berendum.

<ab> ...eƿesa tome iu icƿæs ȝeƿorden ƿita heardoſt .
leodum la<lb break="no"/> ðost ærþan ichim lifes
ƿeȝ rihtne ȝerymde reord be<lb break="no"/>
rendum hƿæt me þaȝeƿeorðode ƿuldres ealdor ofer...
</ab>

att.calendarSystem

att.calendarSystem provides attributes for indicating calendar systems to which a date belongs. [3.6.4. Dates and Times 14.4. Dates]
Moduletei
Membresdate docDate time
Attributs
calendarindique le système ou le calendrier auquel appartient la date exprimée dans le contenu de l'élément.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@calendar]">
<sch:assert test="string-length( normalize-space(.) ) gt 0"> @calendar indicates one or more
systems or calendars to which the date represented by the content of this element belongs,
but this <sch:name/> element has no textual content.</sch:assert>
</sch:rule>
L'année
1960 fut, en vertu du calendrier grégorien, bissextile ; le 22 juin tomba ainsi le jour de
l'été, le <date calendar="#gregorian">22 juin</date>.

att.canonical

att.canonical fournit des attributs qui peuvent être utilisés pour associer une représentation telle qu'un nom ou un titre à l'information canonique concernant l'objet nommé ou auquel il est fait référence. [14.1.1. Linking Names and Their Referents]
Moduletei
Membresatt.naming [att.personal [name] author editor pubPlace rs] authority catDesc date distributor docAuthor docTitle funder principal publisher resp respStmt sponsor term time title
Attributs
keyfournit un moyen, défini de façon externe, d'identifier l'entité (ou les entités) nommé(es), en utilisant une valeur codée d'un certain type.
Statut Optionel
Type de données teidata.text
<author>
 <name key="Hugo, Victor (1802-1885)"
  ref="http://www.idref.fr/026927608">
Victor Hugo</name>
</author>
Note

La valeur peut être un identifiant unique dans une base de données, ou toute autre chaîne définie de façon externe identifiant le référent.

ref(référence) fournit un moyen explicite de localiser une définition complète de l'entité nommée au moyen d'un ou plusieurs URIs.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
<name ref="http://viaf.org/viaf/109557338"
 type="person">
Seamus Heaney</name>
Note

La valeur doit pointer directement vers un ou plusieurs éléments XML au moyen d'un ou plusieurs URIs, séparés par un espace. Si plus d'un URI est fourni, cela implique que le nom identifie plusieurs entités distinctes.

Exemple

In this contrived example, a canonical reference to the same organisation is provided in four different ways.

<author n="1">
 <name ref="http://nzetc.victoria.ac.nz/tm/scholarly/name-427308.html"
  type="organisation">
New Zealand Parliament, Legislative Council</name>
</author>
 
<author n="2">
 <name ref="nzvn:427308"
  type="organisation">
New Zealand Parliament, Legislative Council</name>
</author>
 
<author n="3">
 <name ref="./named_entities.xml#o427308"
  type="organisation">
New Zealand Parliament, Legislative Council</name>
</author>
 

<author n="4">
 <name key="name-427308"
  type="organisation">
New Zealand Parliament, Legislative Council</name>
</author>

The first presumes the availability of an internet connection and a processor that can resolve a URI (most can). The second requires, in addition, a <prefixDef> that declares how the nzvm prefix should be interpreted. The third does not require an internet connection, but does require that a file named named_entities.xml be in the same directory as the TEI document. The fourth requires that an entire external system for key resolution be available.

att.citing

att.citing provides attributes for specifying the specific part of a bibliographic item being cited. [1.3.1. Attribute Classes]
Moduletei
MembresbiblScope
Attributs
unitidentifie le type d'information que transmet l'élément, par exemple colonnes, pages, volume, inscription, etc.
Statut Optionel
Type de données teidata.enumerated
Les valeurs suggérées comprennent:
volume
(volume) l'élément contient un numéro de volume.
issue
l'élément contient un numéro de livraison ou bien un numéro de volume et de livraison.
page
(page) l'élément contient un nombre de pages ou l'étendue de sélection des pages.
line
the element contains a line number or line range.
chapter
(chapitre) l'élément contient une indication de chapitre (le numéro et/ou le titre)
part
l'élément identifie une partie d'un livre ou une anthologie.
column
the element identifies a column.
entry
the element identifies an entry number or label in a list of entries.
fromspecifies the starting point of the range of units indicated by the unit attribute.
Statut Optionel
Type de données teidata.word
tospecifies the end-point of the range of units indicated by the unit attribute.
Statut Optionel
Type de données teidata.word

att.cmc

att.cmc (computer-mediated communication) provides attributes categorizing how the element content was created in a CMC environment.
Moduletei
Membresabbr add address anchor argument bibl byline choice cit closer corr date dateline del desc docAuthor docDate emph epigraph expan figure foreign formula gap gloss graphic head hi idno index interp interpGrp l label lb lg list listBibl mentioned milestone name note num opener orig p pb pc postscript ptr q ref reg rs s salute seg sic signed soCalled stage table term time title trailer unclear w
Attributs
generatedBy(generated by) categorizes how the content of an element was generated in a CMC environment.
Statut Optionel
Type de données teidata.enumerated
Schematron

<sch:rule context="tei:*[@generatedBy]">
<sch:assert test="ancestor-or-self::tei:post">The @generatedBy attribute is for use within a <post> element.</sch:assert>
</sch:rule>
Les valeurs suggérées comprennent:
human
the content was ‘naturally’ typed or spoken by a human user
template
the content was generated after a human user activated a template for its insertion
system
the content was generated by the system, i.e. the CMC environment
bot
the content was generated by a bot, i.e. a non-human agent, typically one that is not part of the CMC environment itself
unspecified
the content was generated by an unknown or unspecified process

automatic system message in chat: user moves on to another chatroom

<post type="eventgeneratedBy="system"
 who="#systemrend="color:blue">

 <p>
  <name type="nicknamecorresp="#A02">McMike</name> geht
   in einen anderen Raum: <name type="roomname">Kreuzfahrt</name>
 </p>
</post>

automatic system message in chat: user enters a chatroom

<post type="eventgeneratedBy="system">
 <p>
  <name type="nicknamecorresp="#A08">c_bo</name> betritt
   den Raum. </p>
</post>

automatic system message in chat: user changes his font color

<post type="eventgeneratedBy="system"
 rend="color:red">

 <p>
  <name type="nicknamecorresp="#A08">c_bo</name> hat die
   Farbe gewechselt.
 </p>
</post>

An automatic signature of user including an automatic timestamp (Wikipedia discussion, anonymized). The specification of generatedBy at the inner element signed is meant to override the specification at the outer element <post>. This is generally possible when the outer generatedBy value is "human".

<post type="standardgeneratedBy="human"
 indentLevel="2synch="#t00394407who="#WU00005582">

 <p> Kurze Nachfrage: Die Hieros für den Goldnamen stammen
   auch von Beckerath gem. Literatur ? Grüße --</p>
 <signed generatedBy="template"
  rend="inline">

  <gap reason="signatureContent"/>
  <time generatedBy="template">18:50, 22. Okt. 2008 (CEST)</time>
 </signed>
</post>

Wikipedia talk page: user signature

<post type="writtengeneratedBy="human">
<!-- ... main content of posting ... -->
 <signed generatedBy="template">
  <gap reason="signatureContent"/>
  <time generatedBy="template">12:01, 12. Jun. 2009 (CEST)</time>
 </signed>
</post>

att.cReferencing

att.cReferencing provides attributes that may be used to supply a canonical reference as a means of identifying the target of a pointer.
Moduletei
Membresgloss ptr ref term
Attributs
cRef(référence canonique) précise la cible du pointeur en fournissant une référence canonique issue d'un modèle défini par un élément refsDecldans l'En-tête TEI.
Statut Optionel
Type de données teidata.text
Note

Le résultat de l’application de l'algorithme pour la résolution des références canoniques (décrit à la section 17.2.5. Canonical References). Ce sera une référence URI valide pour la cible prévue.

La refsDecl à utiliser peut être indiquée à l'aide de l'attribut decls. Actuellement ces Principes directeurs ne permettent que l'encodage d'une unique référence canonique pour tout élément ptr donné.

att.datable

att.datable fournit des attributs pour la normalisation d'éléments qui contiennent des mentions d'événements datés ou susceptibles de l'être [3.6.4. Dates and Times 14.4. Dates]
Moduletei
Membresauthor change creation date docDate editor funder idno licence name principal resp sponsor time title
Attributs
periodfournit un pointeur vers un emplacement donné définissant une période de temps nommée durant laquelle l'item concerné s'inscrit.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

Cette‘superclasse’ fournit des attributs qui peuvent être employés pour donner des valeurs normalisées à des informations relatives au temps. Par défaut, les attributs de la classe att.datable.w3c sont fournis. Si le module pour les noms et les dates est chargé, cette classe fournit également des attributs de la classe att.datable.iso. En général, les valeurs possibles des attributs, limitées aux types de données W3C, forment un sous-ensemble des valeurs que l'on trouve dans la norme ISO 8601. Cependant, il n'est peut-être pas nécessaire de recourir aux possibilités très étendues des types de données de l'ISO. Il existe en effet une bien plus grande offre logicielle pour le traitement des types de données W3C.

att.datable.w3c

att.datable.w3c fournit des attributs pour la normalisation d'éléments qui contiennent des mentions d'événements datés ou susceptibles de l'être [3.6.4. Dates and Times 14.4. Dates]
Moduletei
Membresatt.datable [author change creation date docDate editor funder idno licence name principal resp sponsor time title]
Attributs
whenspécifie une date exacte pour un événement sous une forme normalisée, par ex. aaaa-mm-jj.
Statut Optionel
Type de données teidata.temporal.w3c
<p>
 <date when="1945-10-24">24 Oct 45</date>
 <date when="1996-09-24T07:25:00Z">24 septembre 1996 à 3h 25 du matin</date>
 <time when="1999-01-04T20:42:00-05:00">4 janvier 1999 à 8h de l'après-midi.</time>
 <time when="14:12:38">14 h 12 minutes et 38 secondes</time>
 <date when="1962-10">octobre 1962</date>
 <date when="--06-12">12 juin</date>
 <date when="---01">premier du mois</date>
 <date when="--08">Août</date>
 <date when="2006">MMVI</date>
 <date when="0056">56 ap. J.-C.</date>
 <date when="-0056">56 av. J.-C.</date>
</p>
Shakespeare meurt dix jours plus tard, à Stratford-on-Avon,
Warwickshire, dans l'Angleterre protestante et dans le
calendrier julien, le
<date calendar="#julianwhen="--05-03">mardi 23 avril ancien style</date>,
c'est-à-dire le
<date calendar="#gregorianwhen="--05-03">3 mai</date> dans
le calendrier grégorien.
Schematron

<sch:rule context="tei:*[@when]">
<sch:report test="@notBefore|@notAfter|@from|@to"
 role="nonfatal">
The @when attribute cannot be used with any other att.datable.w3c attributes.</sch:report>
</sch:rule>
Schematron

<sch:rule context="tei:*[@from]">
<sch:report test="@notBefore"
 role="nonfatal">
The @from and @notBefore attributes cannot be used together.</sch:report>
</sch:rule>
Schematron

<sch:rule context="tei:*[@to]">
<sch:report test="@notAfter"
 role="nonfatal">
The @to and @notAfter attributes cannot be used together.</sch:report>
</sch:rule>
Exemple
<date from="1863-05-28to="1863-06-01">28 May through 1 June 1863</date>
Note

La valeur de l'attribut when doit être une représentation normalisée de la date ou de l'heure, ou des deux, dans l'un des formats spécifiés par le XML Schema Part 2: Datatypes Second Edition, selon le calendrier grégorien.

Pour la date, le format le plus courant est yyyy-mm-dd, mais on trouve aussi yyyy, --mm, ---dd, yyyy-mm, ou --mm-dd. Pour l'heure, on utilise le format hh:mm:ss.

Il faut noter qu'actuellement ce format ne permet pas d'utiliser la valeur 0000 pour représenter l'année précédant le début de l'ère chrétienne ; on doit utiliser la valeur -0001.

att.declarable

att.declarable fournit des attributs pour ces éléments de l'en-tête TEI qui peuvent être choisis indépendamment au moyen de l'attribut decls. [16.3. Associating Contextual Information with a Text]
Moduletei
Membresavailability bibl editorialDecl langUsage listBibl projectDesc refsDecl samplingDecl seriesStmt sourceDesc textClass
Attributs
defaultindique si oui ou non cet élément est affecté par défaut quand son élément parent a été sélectionné.
Statut Optionel
Type de données teidata.truthValue
Les valeurs autorisées sont:
true
cet élément est choisi si son parent est choisi
false
cet élément ne peut être sélectionné qu'explicitement, à moins qu'il ne soit le seul de ce type, auquel cas il est sélectionné si son parent a été choisi [Valeur par défaut]
Note

Les règles régissant l'association d'éléments déclarables avec des parties individuelles d'un texte TEI sont entièrement définies au chap1itre 16.3. Associating Contextual Information with a Text. Un seul élément d'un type particulier peut avoir un attribut default avec une valeur true.

att.declaring

att.declaring fournit des attributs pour les éléments qui peuvent être associés indépendamment à un élément particulier déclarable dans l'en-tête TEI, ignorant ainsi la valeur dont cet élément devrait hériter par défaut [16.3. Associating Contextual Information with a Text]
Moduletei
Membresback body div front gloss graphic group lg p ptr ref term text
Attributs
decls(déclarations) identifie un ou plusieurséléments déclarables dans l'en-tête TEI, qui sont destinés à s'appliquer à l'élément portant cet attribut et à son contenu.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

Les règles régissant l'association d'éléments déclarables avec des parties individuelles d'un texte TEI sont entièrement définies au chapitre 16.3. Associating Contextual Information with a Text.

att.dimensions

att.dimensions fournit des attributs pour décrire la taille des objets physiques
Moduletei
Membresadd date del gap time unclear
Attributs
unitnoms des unités utilisées pour la mesure.
Statut Optionel
Type de données teidata.enumerated
Les valeurs suggérées comprennent:
cm
(centimètres)
mm
(millimètres)
in
(pouces)
line
lignes de texte
char
(characters) caractères du texte
quantityspécifie la longueur dans les unités indiquées
Statut Optionel
Type de données teidata.numeric
extentindique la dimension de l'objet en utilisant un vocabulaire spécifique à un projet qui combine la quantité et l'unité dans une chaîne seule de mots.
Statut Optionel
Type de données teidata.text
<gap extent="5 words"/>
<height extent="half the page"/>
precisioncaractérise la précision des valeurs spécifiées par les autres attributs.
Statut Optionel
Type de données teidata.certainty
scopespécifie l'applicabilité de cette mesure, là où plus d'un objet est mesuré.
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
all
la mesure s'applique à tous les cas.
most
la mesure s'applique à la plupart des cas examinés
range
la mesure s'applique seulement à l'ensemble des exemples indiqués.

att.divLike

att.divLike fournit un jeu d'attributs communs à tous les éléments qui offrent les mêmes caractéristiques que des divisions [4. Default Text Structure]
Moduletei
Membresdiv lg
Attributs
org(organisation) précise l'organisation du contenu de la division
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
composite
aucune déclaration n'est faite quant à l'ordre dans lequel les composants de cette division doivent être traités ou bien quant à leurs corrélations
uniform
contenu uniforme : c'est-à-dire que les composants de cet élément sont à considérer comme formant une unité logique et doivent être traités dans l'ordre séquentiel [Valeur par défaut]
sampleindique si cette division est un échantillon de la source originale et dans ce cas, de quelle partie.
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
initial
par rapport à la source, lacune à la fin de la division
medial
par rapport à la source, lacune au début et à la fin de la division
final
par rapport à la source, lacune au début de la division
unknown
par rapport à la source, position de l'échantillon inconnue
complete
la division n'est pas un échantillon [Valeur par défaut]

att.edition

att.edition fournit des attributs identifiant l'édition source dont provient une quelconque caractéristique encodée.
Moduletei
Membreslb milestone pb
Attributs
ed(édition) fournit un identifiant arbitraire pour l'édition source dans laquelle la caractéristique associée (par exemple, une page, une colonne ou un saut de ligne) apparaît à ce point du texte.
Statut Optionel
Type de données 1–∞ occurrences de teidata.word séparé par un espace
edRef(edition reference) provides a pointer to the source edition in which the associated feature (for example, a page, column, or line break) occurs at this point in the text.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Exemple
<l>Of Mans First Disobedience,<lb ed="1674"/> and<lb ed="1667"/> the Fruit</l>
<l>Of that Forbidden Tree, whose<lb ed="1667 1674"/> mortal tast</l>
<l>Brought Death into the World,<lb ed="1667"/> and all<lb ed="1674"/> our woe,</l>
Exemple
<listBibl>
 <bibl xml:id="stapledon1937">
  <author>Olaf Stapledon</author>,
 <title>Starmaker</title>, <publisher>Methuen</publisher>, <date>1937</date>
 </bibl>
 <bibl xml:id="stapledon1968">
  <author>Olaf Stapledon</author>,
 <title>Starmaker</title>, <publisher>Dover</publisher>, <date>1968</date>
 </bibl>
</listBibl>
<!-- ... -->
<p>Looking into the future aeons from the supreme moment of
the cosmos, I saw the populations still with all their
strength maintaining the<pb n="411edRef="#stapledon1968"/>essentials of their ancient culture,
still living their personal lives in zest and endless
novelty of action, … I saw myself still
preserving, though with increasing difficulty, my lucid
con-<pb n="291edRef="#stapledon1937"/>sciousness;</p>

att.editLike

att.editLike fournit des attributs décrivant la nature d'une intervention savante encodée ou de tout autre interprétation. [3.5. Simple Editorial Changes 11.3.1. Origination 14.3.2. The Person Element 12.3.1.1. Core Elements for Transcriptional Work]
Moduletei
Membresatt.transcriptional [add del] corr date expan gap name reg time unclear
Attributs
evidenceindique la nature de la preuve attestant la fiabilité ou la justesse de l'intervention ou de l'interprétation.
Statut Optionel
Type de données 1–∞ occurrences de teidata.enumerated séparé par un espace
Les valeurs suggérées comprennent:
internal
l'intervention est justifiée par une preuve interne
external
l'intervention est justifiée par une preuve externe
conjecture
l'intervention ou l'interprétation a été faite par le rédacteur, le catalogueur, ou le chercheur sur la base de leur expertise.
instantindicates whether this is an instant revision or not.
Statut Optionel
Type de données teidata.xTruthValue
Valeur par défaut false
Note

Les membres de cette classe d'attributs sont couramment employés pour représenter tout type d'intervention éditoriale dans un texte, par exemple une correction ou une interprétation, ou bien une datation ou une localisation de manuscrit, etc.

att.fragmentable

att.fragmentable provides attributes for representing fragmentation of a structural element, typically as a consequence of some overlapping hierarchy.
Moduletei
Membresatt.divLike [div lg] att.segLike [pc s seg w] l p
Attributs
partspecifies whether or not its parent element is fragmented in some way, typically by some other overlapping structure: for example a speech which is divided between two or more verse stanzas, a paragraph which is split across a page division, a verse line which is divided between two speakers.
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
Y
(yes) the element is fragmented in some (unspecified) respect
N
(no) the element is not fragmented, or no claim is made as to its completeness [Valeur par défaut]
I
(initial) this is the initial part of a fragmented element
M
(medial) this is a medial part of a fragmented element
F
(final) this is the final part of a fragmented element

att.global

att.global fournit un jeu d'attributs communs à tous les éléments dans le système de codage TEI. [1.3.1.1. Global Attributes]
Moduletei
MembresTEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w
Attributs
xml:id(identifiant) fournit un identifiant unique pour l'élément qui porte l'attribut
Statut Optionel
Type de données ID
Note

L'attribut xml:id peut être employé pour indiquer une référence canonique pour un élément ; voir la section3.11. Reference Systems.

n(nombre) donne un nombre (ou une autre étiquette) pour un élément, qui n'est pas nécessairement unique dans le document TEI.
Statut Optionel
Type de données teidata.text
Note

L'attribut n peut être employé pour indiquer la numérotation de chapitres, sections, items de liste, etc. ; il peut également être employé dans les spécifications d'un système standard de référence pour le texte.

xml:lang(langue) indique la langue du contenu de l'élément en utilisant les codes du RFC 3066
Statut Optionel
Type de données teidata.language
<p> … The consequences of
this rapid depopulation were the loss of the last
<foreign xml:lang="rap">ariki</foreign> or chief
(Routledge 1920:205,210) and their connections to
ancestral territorial organization.</p>
Note

Si aucune valeur n'est indiquée pour xml:lang, la valeur de l'attributxml:lang de l'élément immédiatement supérieur est héritée ; c'est pour cette raison qu'une valeur devrait toujours être attribuée à l'élément du plus haut niveau hiérarchique (TEI).

La valeur doit être conforme au BCP 47. Si la valeur est un code d'usage privé (c'est-à-dire commence par x- ou contient -x-), il devrait correspondre à la valeur d'un attribut ident d'un élément language fourni dans l'en-tête TEI du document courant.

xml:spacesignale que les applications doivent préserver l'espace blanc
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
default
signals that the application's default white-space processing modes are acceptable
preserve
indicates the intent that applications preserve all white space

att.global.analytic

att.global.analytic fournit des attributs globaux complémentaires pour associer des analyses ou des interprétations spécifiques avec des portions de texte appropriées. [18.2. Global Attributes for Simple Analyses 18.3. Spans and Interpretations]
Moduleanalysis
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
ana(analyse) indique un ou plusieurs éléments contenant des interprétations de l'élément qui porte l'attribut ana.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

Quand on donne de multiples valeurs, celles-ci peuvent refléter, soit des interprétations multiples et divergentes d'un texte ambigu soit des interprétations multiples et compatibles du même passage dans différents contextes.

att.global.facs

att.global.facs attributs utilisables pour les éléments correspondant à tout ou partie d'une image, parce qu'ils contiennent une représentation alternative de cette image, généralement mais pas nécessairement, une transcription. [12.1. Digital Facsimiles]
Moduletranscr
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
facs(fac-similé) pointe directement vers une image ou vers une partie d'une image correspondant au contenu de l'élément.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace

att.global.linking

att.global.linking fournit un ensemble d'attributs pour décrire les liens hypertextuels. [17. Linking, Segmentation, and Alignment]
Modulelinking
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
corresp(correspond) pointe vers des éléments qui ont une correspondance avec l'élément en question.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
<group>
 <text xml:id="t1-g1-t1xml:lang="mi">
  <body xml:id="t1-g1-t1-body1">
   <div type="chapter">
    <head>He Whakamaramatanga mo te Ture Hoko, Riihi hoki, i nga Whenua Maori, 1876.</head>
    <p></p>
   </div>
  </body>
 </text>
 <text xml:id="t1-g1-t2xml:lang="en">
  <body xml:id="t1-g1-t2-body1"
   corresp="#t1-g1-t1-body1">

   <div type="chapter">
    <head>An Act to regulate the Sale, Letting, and Disposal of Native Lands, 1876.</head>
    <p></p>
   </div>
  </body>
 </text>
</group>

In this example a group contains two texts, each containing the same document in a different language. The correspondence is indicated using corresp. The language is indicated using xml:lang, whose value is inherited; both the tag with the corresp and the tag pointed to by the corresp inherit the value from their immediate parent.


<!-- In a placeography called "places.xml" --><place xml:id="LOND1"
 corresp="people.xml#LOND2 people.xml#GENI1">

 <placeName>London</placeName>
 <desc>The city of London...</desc>
</place>
<!-- In a literary personography called "people.xml" -->
<person xml:id="LOND2"
 corresp="places.xml#LOND1 #GENI1">

 <persName type="lit">London</persName>
 <note>
  <p>Allegorical character representing the city of <placeName ref="places.xml#LOND1">London</placeName>.</p>
 </note>
</person>
<person xml:id="GENI1"
 corresp="places.xml#LOND1 #LOND2">

 <persName type="lit">London’s Genius</persName>
 <note>
  <p>Personification of London’s genius. Appears as an
     allegorical character in mayoral shows.
  </p>
 </note>
</person>

In this example, a <place> element containing information about the city of London is linked with two <person> elements in a literary personography. This correspondence represents a slightly looser relationship than the one in the preceding example; there is no sense in which an allegorical character could be substituted for the physical city, or vice versa, but there is obviously a correspondence between them.

nextpointe vers l'élément suivant d'un ensemble virtuel dont l'élément en question est une partie.
Statut Optionel
Type de données teidata.pointer
prev( précédent) pointe vers l'élément précédent d'un ensemble virtuel auquel appartient l'élément en question.
Statut Optionel
Type de données teidata.pointer

att.global.rendition

att.global.rendition provides rendering attributes common to all elements in the TEI encoding scheme. [1.3.1.1.3. Rendition Indicators]
Moduletei
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
rend(interprétation) indique comment l'élément en question a été rendu ou présenté dans le texte source
Statut Optionel
Type de données 1–∞ occurrences de teidata.word séparé par un espace
<head rend="align(center) case(allcaps)">épître dédicatoire<lb/>à <lb/>Monsieur de Coucy <lb/>
 <lb/>.</head>
Note

Ces Principes directeurs ne font aucune recommandation contraignante pour les valeurs de l'attribut rend; les caractéristiques de la présentation visuelle changent trop d'un texte à l'autre et la décision d'enregistrer ou d'ignorer des caractéristiques individuelles est trop variable d'un projet à l'autre. Quelques conventions potentiellement utiles sont notées de temps en temps à des points appropriés dans ces Principes directeurs.

att.global.responsibility

att.global.responsibility provides attributes indicating the agent responsible for some aspect of the text, the markup or something asserted by the markup, and the degree of certainty associated with it. [1.3.1.1.4. Sources, certainty, and responsibility 3.5. Simple Editorial Changes 12.3.2.2. Hand, Responsibility, and Certainty Attributes 18.3. Spans and Interpretations 14.1.1. Linking Names and Their Referents]
Moduletei
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
cert(certitude) donne le degré de certitude associée à l'intervention ou à l'interprétation.
Statut Optionel
Type de données teidata.probCert
resp(responsable) indique l'agent responsable de l'intervention ou de l'interprétation, par exemple un éditeur ou un transcripteur.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Exemple
Blessed are the
<choice>
 <sic>cheesemakers</sic>
 <corr resp="#editorcert="high">peacemakers</corr>
</choice>: for they shall be called the children of God.
Exemple

<!-- in the <text> ... --><lg>
<!-- ... -->
 <l>Punkes, Panders, baſe extortionizing
   sla<choice>
   <sic>n</sic>
   <corr resp="#JENS1_transcriber">u</corr>
  </choice>es,</l>
<!-- ... -->
</lg>
<!-- in the <teiHeader> ... -->
<!-- ... -->
<respStmt xml:id="JENS1_transcriber">
 <resp when="2014">Transcriber</resp>
 <name>Janelle Jenstad</name>
</respStmt>

att.global.source

att.global.source provides attributes used by elements to point to an external source. [1.3.1.1.4. Sources, certainty, and responsibility 3.3.3. Quotation 8.3.4. Writing]
Moduletei
Membresatt.global [TEI abbr add addrLine address anchor argument att author authority availability back bibl biblScope body byline catDesc catRef category cell change choice cit classCode classDecl closer code corr creation date dateline del desc distributor div divGen docAuthor docDate docEdition docImprint docTitle edition editionStmt editor editorialDecl eg emph encodingDesc epigraph expan extent figDesc figure fileDesc foreign formula front funder gap gi gloss graphic group head hi ident idno imprimatur index interp interpGrp item keywords l label langUsage language lb lg licence list listBibl mentioned milestone name note notesStmt num opener orig p pb pc postscript principal profileDesc projectDesc ptr pubPlace publicationStmt publisher q ref refsDecl reg relatedItem resp respStmt revisionDesc row rs s salute samplingDecl seg seriesStmt sic signed soCalled sourceDesc sp speaker sponsor stage table taxonomy teiCorpus teiHeader term text textClass time title titlePage titlePart titleStmt trailer unclear val w]
Attributs
sourcespecifies the source from which some aspect of this element is drawn.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Schematron

<sch:rule context="tei:*[@source]">
<sch:let name="srcs"
 value="tokenize( normalize-space(@source),' ')"/>

<sch:report test="( self::tei:classRef | self::tei:dataRef | self::tei:elementRef | self::tei:macroRef | self::tei:moduleRef | self::tei:schemaSpec ) and $srcs[2]"> When used on a schema description element (like
<sch:value-of select="name(.)"/>), the @source attribute
should have only 1 value. (This one has <sch:value-of select="count($srcs)"/>.)
</sch:report>
</sch:rule>
Exemple
<p>
<!-- ... --> As Willard McCarty (<bibl xml:id="mcc_2012">2012, p.2</bibl>) tells us, <quote source="#mcc_2012">‘Collaboration’ is a problematic and should be a contested
   term.</quote>
<!-- ... -->
</p>
Exemple
<p>
<!-- ... -->
 <quote source="#chicago_15_ed">Grammatical theories are in flux, and the more we learn, the
   less we seem to know.</quote>
<!-- ... -->
</p>
<!-- ... -->
<bibl xml:id="chicago_15_ed">
 <title level="m">The Chicago Manual of Style</title>,
<edition>15th edition</edition>. <pubPlace>Chicago</pubPlace>: <publisher>University of
   Chicago Press</publisher> (<date>2003</date>), <biblScope unit="page">p.147</biblScope>.

</bibl>
Exemple
<elementRef key="psource="tei:2.0.1"/>

Include in the schema an element named p available from the TEI P5 2.0.1 release.

Exemple
<schemaSpec ident="myODD"
 source="mycompiledODD.xml">

<!-- further declarations specifying the components required -->
</schemaSpec>

Create a schema using components taken from the file mycompiledODD.xml.

att.interpLike

att.interpLike fournit les attributs pour des éléments qui exposent une analyse ou une interprétation formelles. [18.2. Global Attributes for Simple Analyses]
Moduletei
Membresinterp interpGrp
Attributs
typeindique quel genre de phénomène est noté dans le passage.
Statut Recommendé
Type de données teidata.enumerated
Exemple de valeurs possibles:
image
identifie une image dans le passage.
character
identifie un personnage associé au passage.
theme
identifie un thème dans le passage.
allusion
identifie une allusion à un autre texte.
subtype(sous-type) provides a sub-categorization of the phenomenon is being noted in the passage, if needed
Statut Optionel
Type de données teidata.enumerated
Note

L'attribut subtype peut être employé pour fournir une sous-classification pour cet élément, en plus de celle fournie par son propre attribut type.

inst(cas) pointe vers les instances de l'analyse ou de l'interprétation représentées par l'élément courant.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

L'élément courant doit être analytique. L'élément pointé doit être textuel.

att.lexicographic.normalized

att.lexicographic.normalized provides attributes for usage within word-level elements in the analysis module and within lexicographic microstructure in the dictionaries module.
Moduleanalysis
Membresatt.linguistic [pc w]
Attributs
norm(normalisé) donne une forme normalisée de l'information fournie par le texte source sous une forme non normalisée.
Statut Optionel
Type de données teidata.text
<gramGrp>
 <pos norm="nom">n.</pos>
</gramGrp>
orig(original) indique la chaîne originale ou contient une chaîne vide si l'élément n'apparaît pas dans le texte source.
Statut Optionel
Type de données teidata.text

Example from a language documentation project of the Mixtepec-Mixtec language (ISO 639-3: 'mix'). This is a use case where speakers spell something incorrectly but we would like to preserve it for any number of reasons, the use of orig is essential and could have uses for both the speaker to see past mistakes, researchers to get insight into how untrained speakers write their language instinctually (in contrast to prescribed convention), etc.:

<w orig="ntsa sia'i">ntsasia'i</w>

Example from the EarlyPrint project. Fragment of text where obvious errors have been corrected but the original forms remain recorded:

<w lemma="hepos="pns"
 xml:id="b1afj-003-a-0950">
he</w>
<w lemma="havepos="vvz"
 xml:id="b1afj-003-a-0960">
hath</w>
<w lemma="bringpos="vvn"
 xml:id="b1afj-003-a-0970">
brought</w>
<w lemma="forthpos="av"
 xml:id="b1afj-003-a-0980orig="sorth">
forth</w>

An example from the EarlyPrint project showing the use of both norm and orig. The orig attribute preserves the original version (sometimes with spelling errors, often with printer abbreviations), the element content resolves printer abbreviations but retains the original orthography, and the norm attribute holds normalized values:

<w lemma="commandmentpos="n1"
 norm="commandmentxml:id="b9avr-018-a-7720"
 orig="commandemēt">
commandement</w>

att.linguistic

att.linguistic provides a set of attributes concerning linguistic features of tokens, for usage within token-level elements, specifically w and pc in the analysis module. [18.4.2. Lightweight Linguistic Annotation]
Moduleanalysis
Membrespc w
Attributs
lemmafournit le lemme du mot (entrée du dictionnaire)
Statut Optionel
Type de données teidata.text
<w lemma="wife">wives</w>
<w lemma="Arznei">Artzeneyen</w>
lemmaRefprovides a pointer to a definition of the lemma for the word, for example in an online lexicon.
Statut Optionel
Type de données teidata.pointer
<w type="verblemma="nage"
 lemmaRef="http://www.example.com/lexicon/hitvb.xml">
nag<m type="suffix">er</m>
</w>
pos(part of speech) indicates the part of speech assigned to a token (i.e. information on whether it is a noun, adjective, or verb), usually according to some official reference vocabulary (e.g. for German: STTS, for English: CLAWS, for Polish: NKJP, etc.).
Statut Optionel
Type de données teidata.text

The German sentence ‘Wir fahren in den Urlaub.’ tagged with the Stuttgart-Tuebingen-Tagset (STTS).

<s>
 <w pos="PPER">Wir</w>
 <w pos="VVFIN">fahren</w>
 <w pos="APPR">in</w>
 <w pos="ART">den</w>
 <w pos="NN">Urlaub</w>
 <w pos="$.">.</w>
</s>

The English sentence ‘We're going to Brazil.’ tagged with the CLAWS-5 tagset, arranged inline (with significant whitespace).

<p><w pos="PNP">We</w><w pos="VBB">'re</w> <w pos="VVG">going</w> <w pos="PRP">to</w> <w pos="NP0">Brazil</w><pc pos="PUN">.</pc></p>         

The English sentence ‘We're going on vacation to Brazil for a month!’ tagged with the CLAWS-7 tagset and arranged sequentially.

<p>
 <w pos="PPIS2">We</w>
 <w pos="VBR">'re</w>
 <w pos="VVG">going</w>
 <w pos="II">on</w>
 <w pos="NN1">vacation</w>
 <w pos="II">to</w>
 <w pos="NP1">Brazil</w>
 <w pos="IF">for</w>
 <w pos="AT1">a</w>
 <w pos="NNT1">month</w>
 <pc pos="!">!</pc>
</p>
msd(morphosyntactic description) supplies morphosyntactic information for a token, usually according to some official reference vocabulary (e.g. for German: STTS-large tagset; for a feature description system designed as (pragmatically) universal, see Universal Features).
Statut Optionel
Type de données teidata.text
<ab>
 <w pos="PPERmsd="1.Pl.*.Nom">Wir</w>
 <w pos="VVFINmsd="1.Pl.Pres.Ind">fahren</w>
 <w pos="APPRmsd="--">in</w>
 <w pos="ARTmsd="Def.Masc.Akk.Sg">den</w>
 <w pos="NNmsd="Masc.Akk.Sg">Urlaub</w>
 <pc pos="$.msd="--">.</pc>
</ab>
joinwhen present, provides information on whether the token in question is adjacent to another, and if so, on which side.
Statut Optionel
Type de données teidata.text
Les valeurs autorisées sont:
no
the token is not adjacent to another
left
there is no whitespace on the left side of the token
right
there is no whitespace on the right side of the token
both
there is no whitespace on either side of the token
overlap
the token overlaps with another; other devices (specifying the extent and the area of overlap) are needed to more precisely locate this token in the character stream

The example below assumes that the lack of whitespace is marked redundantly, by using the appropriate values of join.

<s>
 <pc join="right">"</pc>
 <w join="left">Friends</w>
 <w>will</w>
 <w>be</w>
 <w join="right">friends</w>
 <pc join="both">.</pc>
 <pc join="left">"</pc>
</s>

Note that a project may make a decision to only indicate lack of whitespace in one direction, or do that non-redundantly. The existing proposal is the broadest possible, on the assumption that we adopt the "streamable view", where all the information on the current element needs to be represented locally.

The English sentence ‘We're going on vacation.’ tagged with the CLAWS-5 tagset, arranged sequentially, tagged on the assumption that only the lack of the preceding whitespace is indicated.

<p>
 <w pos="PNP">We</w>
 <w pos="VBBjoin="left">'re</w>
 <w pos="VVG">going</w>
 <w pos="PRP">on</w>
 <w pos="NN1">vacation</w>
 <pc pos="PUNjoin="left">.</pc>
</p>

att.media

att.media provides attributes for specifying display and related properties of external media.
Moduletei
Membresgraphic
Attributs
widthWhere the media are displayed, indicates the display width
Statut Optionel
Type de données teidata.outputMeasurement
heightWhere the media are displayed, indicates the display height
Statut Optionel
Type de données teidata.outputMeasurement
scaleWhere the media are displayed, indicates a scale factor to be applied when generating the desired display size
Statut Optionel
Type de données teidata.numeric

att.milestoneUnit

att.milestoneUnit provides attributes to indicate the type of section which is changing at a specific milestone. [3.11.3. Milestone Elements 2.3.6.3. Milestone Method 2.3.6. The Reference System Declaration]
Modulecore
Membresmilestone
Attributs
unitfournit un nom conventionnel pour le type de section qui change à partir de cette balise de bornage
Statut Requis
Type de données teidata.enumerated
Les valeurs suggérées comprennent:
page
sauts de page matériels (synonymes de l'élément pb)
column
sauts de colonnes
line
sauts de ligne (synonymes de l'élémentlb)
book
n'importe quel unité désignée par les termes livre, liber, etc.
poem
poèmes séparés dans une collection
canto
chants ou autres parties principales dans une poésie
speaker
changement de locuteur ou de narrateur
stanza
strophes dans une poésie, livre, ou chant
act
actes dans une pièce
scene
scènes dans une pièce ou dans un acte
section
parties de toute catégorie.
absent
passages qui ne sont pas présents dans l'édition de référence.
unnumbered
passages figurant dans le texte, mais qui ne sont pas destinés à être inclus comme élément de référence.
<milestone n="23ed="Launit="Dreissiger"/>
... <milestone n="24ed="AVunit="verse"/> ...
<milestone n="23ed="Launit="Dreissiger"/> ... <milestone n="24ed="AVunit="verse"/>
...
Note

Si l'élément milestone marque le début d'un fragment de texte qui n'est pas présent dans l'édition de référence, la valeur absent peut être donnée à l'attribut unit. On comprendra alors que l'édition de référence ne contient pas le fragment de texte qui suit et qui s'achève à la balise milestone suivante dans le texte.

En plus des valeurs proposées pour cet attribut, d'autres termes peuvent être appropriés (par ex. Stephanus pour les numéros dits de Henri Estienne dans les éditions de Platon).

L'attribut type sera utilisé pour caractériser l’unité de bornage sans autre précaution d’emploi que celle de l'identification du type d'unité, par exemple s’il s’agit d’un mot coupé ou pas.

att.naming

att.naming fournit des attributs communs aux éléments qui font référence à des personnes, lieux, organismes, etc., nommés. [3.6.1. Referring Strings 14.3.7. Names and Nyms]
Moduletei
Membresatt.personal [name] author editor pubPlace rs
Attributs
rolemay be used to specify further information about the entity referenced by this name in the form of a set of whitespace-separated values, for example the occupation of a person, or the status of a place.
Statut Optionel
Type de données 1–∞ occurrences de teidata.enumerated séparé par un espace
nymRef(référence au nom canonique) indique comment localiser la forme canonique (nym) des noms qui sont associés à l'objet nommé par l'élément qui le contient.
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

La valeur doit pointer directement vers un ou plusieurs éléments XML au moyen d'un ou plusieurs URIs, séparés par un espace blanc. Si plus d'un URI est fourni, alors le nom est associé à plusieurs noms canoniques distincts.

att.notated

att.notated provides attributes to indicate any specialised notation used for element content.
Moduletei
Membresformula s seg w
Attributs
notationprécise le nom d'une notation définie précédemment, utilisée dans le contenu de l'élément.
Statut Optionel
Type de données teidata.enumerated

att.personal

att.personal (attributs des composantes des noms de personnes) attributs communs des éléments qui composent un nom de personne [14.2.1. Personal Names]
Moduletei
Membresname
Attributs
fullindique si la composante du nom est donnée en intégralité, sous forme d'abréviation ou simplement d'initiale.
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
yes
(complet) la composante du nom est orthographiée en intégralité. [Valeur par défaut]
abb
(abrégé) la composante du nom est donnée sous forme abrégée.
init
(initiale) la composante du nom n'est indiquée que par sa lettre initiale.
sort(ordre) précise dans quel ordre est placé la composante par rapport aux autres dans le nom d'une personne.
Statut Optionel
Type de données teidata.count

att.placement

att.placement fournit des attributs pour décrire l'emplacement où apparaît un élément textuel dans la page ou l'objet source. [3.5.3. Additions, Deletions, and Omissions 12.3.1.4. Additions and Deletions]
Moduletei
Membresadd figure head label note stage trailer
Attributs
placespecifie où cet item se trouve.
Statut Recommendé
Type de données 1–∞ occurrences de teidata.enumerated séparé par un espace
Les valeurs suggérées comprennent:
top
dans la marge supérieure
bottom
dans la marge inférieure
margin
dans la marge (gauche, droite ou les deux en même temps)
opposite
sur la page opposée
overleaf
de l'autre côté de la feuille
above
au-dessus de la ligne
right
to the right, e.g. to the right of a vertical line of text, or to the right of a figure
below
au-dessous de la ligne
left
to the left, e.g. to the left of a vertical line of text, or to the left of a figure
end
à la fin, par exemple d'un chapitre ou d'un volume
inline
dans le corps du texte
inspace
dans un espace prédéfini, par exemple à gauche d'un scripteur précédent
<add place="margin">[An addition written in the margin]</add>
<add place="bottom opposite">[An addition written at the
foot of the current page and also on the facing page]</add>
<note place="bottom">Ibid, p.7</note>

att.pointing

att.pointing fournit un ensemble d'attributs utilisés par tous les éléments qui pointent vers d'autres éléments au moyen d'une ou de plusieurs références URI. [1.3.1.1.2. Language Indicators 3.7. Simple Links and Cross-References]
Moduletei
MembrescatRef gloss licence note ptr ref term
Attributs
targetLangspecifies the language of the content to be found at the destination referenced by target, using a ‘language tag’ generated according to BCP 47.
Statut Optionel
Type de données teidata.language
Schematron

<sch:rule context="tei:*[not(self::tei:schemaSpec)][@targetLang]">
<sch:assert test="@target">@targetLang should only be used on <sch:name/> if @target is specified.</sch:assert>
</sch:rule>
<linkGrp xml:id="pol-swh_aln_2.1-linkGrp">
 <ptr xml:id="pol-swh_aln_2.1.1-ptr"
  target="pol/UDHR/text.xml#pol_txt_1-headtype="tuvtargetLang="pl"/>

 <ptr xml:id="pol-swh_aln_2.1.2-ptr"
  target="swh/UDHR/text.xml#swh_txt_1-headtype="tuvtargetLang="sw"/>

</linkGrp>

In the example above, the <linkGrp> combines pointers at parallel fragments of the Universal Declaration of Human Rights: one of them is in Polish, the other in Swahili.

targetprécise la cible de la référence en donnant une ou plusieurs références URI
Statut Optionel
Type de données 1–∞ occurrences de teidata.pointer séparé par un espace
Note

Une ou plusieurs références URI syntaxiquement valables, séparée par un espace. Puisqu'un espace est employé pour séparer des URIs, aucun espace n’est autorisé à l'intérieur d'un URI. Si un espace est requis dans un URI, il faut le représenter avec une séquence d'échappement, comme par exemple TEI%20Consortium.

evaluate(évalué) détermine le sens attendu, si la cible d'un pointeur est elle-même un pointeur.
Statut Optionel
Type de données teidata.enumerated
Les valeurs autorisées sont:
all
si l'élément pointé est lui-même un pointeur, alors on prendra la cible de ce pointeur, et ainsi de suite jusqu'à trouver un élément qui n'est pas un pointeur.
one
si l'élément pointé est lui-même un pointeur, alors sa cible (qui est ou non un pointeur) devient la cible retenue.
none
aucune évaluation ultérieure des cibles n'est menée au-delà de la recherche de l'élément désigné dans la cible du pointeur.
Note

Si aucune valeur n'est fournie, c'est au programme d'application de décider (éventuellement à partir d'une donnée entrée par l'utilisateur) jusqu'où retracer une chaîne de pointeurs.

att.ranging

att.ranging provides attributes for describing numerical ranges.
Moduletei
Membresatt.dimensions [add date del gap time unclear] num
Attributs
atLeastdonne une estimation de la valeur minimum pour la mesure.
Statut Optionel
Type de données teidata.numeric
atMostdonne une estimation de la valeur maximum pour la mesure.
Statut Optionel
Type de données teidata.numeric
minlorsque la mesure résume plus d'une observation, fournit la valeur minimum observée.
Statut Optionel
Type de données teidata.numeric
maxlorsque la mesure résume plus d'une observation, fournit la valeur maximum observée.
Statut Optionel
Type de données teidata.numeric
confidencespecifies the degree of statistical confidence (between zero and one) that a value falls within the range specified by min and max, or the proportion of observed values that fall within that range.
Statut Optionel
Type de données teidata.probability
Exemple
The MS. was lost in transmission by mail from <del rend="overstrike">
 <gap reason="illegible"
  extent="one or two lettersatLeast="1atMost="2unit="chars"/>

</del> Philadelphia to the Graphic office, New York.
Exemple
Americares has been supporting the health sector in Eastern
Europe since 1986, and since 1992 has provided <measure atLeast="120000000unit="USD"
 commodity="currency">
more than
$120m</measure> in aid to Ukrainians.

att.resourced

att.resourced provides attributes by which a resource (such as an externally held media file) may be located.
Moduletei
Membresgraphic
Attributs
url(adresse URL) specifies the URL from which the media concerned may be obtained.
Statut Requis
Type de données teidata.pointer

att.segLike

att.segLike fournit des attributs pour des éléments utilisés pour une segmentation arbitraire. [17.3. Blocks, Segments, and Anchors 18.1. Linguistic Segment Categories]
Moduletei
Membrespc s seg w
Attributs
function(fonction) caractérise la fonction du segment.
Statut Optionel
Type de données teidata.enumerated

att.sortable

att.sortable provides attributes for elements in lists or groups that are sortable, but whose sorting key cannot be derived mechanically from the element content. [10.1. Dictionary Body and Overall Structure]
Moduletei
Membresbibl idno item list listBibl term
Attributs
sortKeysupplies the sort key for this element in an index, list or group which contains it.
Statut Optionel
Type de données teidata.word
Je me suis
procuré une <term>clef anglaise</term> pour dévisser les écrous qui attachent le canot à
la coque du Nautilus. Ainsi tout est prêt.
Note

La clé de tri est utilisée pour déterminer la séquence et le groupement d'entrées dans un index. Elle fournit une séquence de caractères qui, lorsqu'ils sont triés avec les autres valeurs, produisent l'ordre souhaité ; les détails de construction d'une clé de tri dépendent des applications. .

La structure d'un dictionnaire diffère souvent de l'ordre de collation des jeux de caractères lisibles par la machine ; dans des dictionnaires de langue anglaise, une entrée pour 4-H apparaîtra souvent alphabétiquement sous ‘fourh’, et McCoypeut être classé alphabétiquement sous ‘maccoy’, tandis que A1, A4 et A5 apparaîtront tous dans un ordre alphanumérique entre ‘a-’ et ‘AA’. La clef de tri est exigée si l'orthographe de l'entrée du dictionnaire n'est pas suffisante pour déterminer son emplacement.

att.spanning

att.spanning fournit des attributs pour les éléments qui délimitent un passage de texte par des mécanismes de pointage plutôt qu'en entourant le passage. [12.3.1.4. Additions and Deletions 1.3.1. Attribute Classes]
Moduletei
Membresindex lb milestone pb
Attributs
spanToindique la fin d'un passage introduit par l'élément portant cet attribut.
Statut Optionel
Type de données teidata.pointer
SchematronThe @spanTo attribute must point to an element following the current element

<sch:rule context="tei:*[@spanTo]">
<sch:assert test="id(substring(@spanTo,2)) and following::*[@xml:id=substring(current()/@spanTo,2)]">The element indicated by @spanTo (<sch:value-of select="@spanTo"/>) must follow the current element <sch:name/>
</sch:assert>
</sch:rule>
Note

Le passage est défini comme courant depuis le début du contenu de l'élément pointeur (s'il y en a un) jusqu'à la fin du contenu de l'élément pointé par l'attribut spanTo (s'il y en a un), dans l'ordre du document. Si aucune valeur n'est fournie pour l'attribut, il est entendu que le passage est de même étendue que l'élément pointeur.

att.tableDecoration

att.tableDecoration fournit des attributs pour mettre en forme les lignes ou les cellules d'un tableau. [15. Tables, Formulæ, Graphics, and Notated Music]
Modulefigures
Membrescell row
Attributs
role(rôle) indique le type des informations contenues dans cette cellule ou dans chaque cellule de cette ligne.
Statut Optionel
Type de données teidata.enumerated
Les valeurs suggérées comprennent:
label
uniquement des informations relatives au codage ou à la description
data
valeurs de données [Valeur par défaut]
Note

Quand cet attribut est appliqué à une ligne de tableau, sa valeur est transmise comme valeur par défaut à toutes les cellules de cette ligne. Quand il est spécifié sur une cellule, sa valeur annule et remplace toute valeur spécifiée par défaut dans l'attribut role de l'élément parent row.

rows(lignes) indique le nombre de lignes occupées par la cellule ou la ligne en question.
Statut Optionel
Type de données teidata.count
Valeur par défaut 1
Note

Lorsque plusieurs cellules s'étendent sur plusieurs lignes, il peut être plus pratique d'employer des tableaux inclus.

cols(colonnes) indique le nombre de colonnes occupées par cette cellule ou cette ligne.
Statut Optionel
Type de données teidata.count
Valeur par défaut 1
Note

Une valeur plus grande que 1 indique que cette cellule (ou cette ligne) occupe plusieurs colonnes. Lorsqu'une première cellule s'étend sur une ligne entière, il peut être préférable de la considérer comme un titre.

att.timed

att.timed fournit des attributs communs aux éléments qui expriment une durée dans le temps, soit de manière absolue, soit en se référant à une carte d'alignement. [8.3.5. Temporal Information]
Moduletei
Membresgap
Attributs
startindique dans un alignement temporel (un ordre chronologique) l'endroit où commence cet élément.
Statut Optionel
Type de données teidata.pointer
Note

Si aucune valeur n'est donnée, il est entendu que l'élément suit l'élément immédiatement précédent au même niveau hiérarchique.

endindique l'endroit où se termine cet élément dans un alignement temporel.
Statut Optionel
Type de données teidata.pointer
Note

Si aucune valeur n'est donnée, il est entendu que l'élément précède l'élément immédiatement suivant au même niveau hiérarchique.

att.transcriptional

att.transcriptional fournit des attributs spécifiques au codage d'éléments relatifs à l'intervention de l'auteur ou du copiste dans un texte lors de la transcription de sources manuscrites ou assimilées. [12.3.1.4. Additions and Deletions]
Moduletei
Membresadd del
Attributs
statusindique la conséquence de l'intervention, par exemple dans le cas d'un effacement, une biffure, qui inclut trop ou pas assez de texte, ou dans le cas d'un ajout, une insertion, qui reproduit une portion du texte déjà présent.
Statut Optionel
Type de données teidata.enumerated
Exemple de valeurs possibles:
duplicate
tout le texte indiqué comme étant une addition reprend le texte de l'original, que la duplication soit identique mot pour mot ou moins exacte.
duplicate-partial
la partie du texte indiquée comme étant un ajout est redondante avec un texte présent dans l'original.
excessStart
un passage du texte situé au début de la supression est indiqué comme supprimé bien qu'à l'évidence il ne devrait pas l'être.
excessEnd
un passage du texte situé à la fin de la supression est indiqué comme supprimé bien qu'à l'évidence il ne devrait pas l'être.
shortStart
un passage du texte situé au début de la supression n'est pas indiqué comme supprimé bien qu'à l'évidence il devrait l'être.
shortEnd
un passage du texte situé à la fin de la supression n'est pas indiqué comme supprimé bien qu'à l'évidence il devrait l'être.
partial
un passage du texte dans la supression n'est pas indiqué comme disparu bien qu'à l'évidence il devrait l'être.
unremarkable
l'indication de suppression n'est pas erronée. [Valeur par défaut]
Note

Il est rarement nécessaire de donner de l'information sur le statut de chaque suppression sauf dans le cas des éditions critiques de manuscrits d'auteur, l'information sur le statut des additions étant encore plus rare.

L'indication d'une suppression ou d'une addition comme erronée est indéniablement un acte d'interprétation ; le test habituel appliqué dans la pratique est l'acceptabilité linguistique du texte avec et sans les lettres ou mots en question.

causedocuments the presumed cause for the intervention.
Statut Optionel
Type de données teidata.enumerated
seq(séquence) assigne un numéro séquentiel relatif à l'ordre dans lequel les traits encodés portant cet attribut sont supposés être apparus.
Statut Optionel
Type de données teidata.count

att.translatable

att.translatable fournit les attributs utilisés pour indiquer le statut d'une partie traduisible d'un document ODD.
Moduletagdocs
Membresdesc gloss
Attributs
versionDatespécifie le nom de la version ou le numéro de la source dont la version traduite a été tirée.
Statut Optionel
Type de données teidata.temporal.working

att.typed

att.typed fournit des attributs qui peuvent être utilisés pour classer ou interclasser des éléments de n'importe quelle façon. [1.3.1. Attribute Classes 18.1.1. Words and Above 3.6.1. Referring Strings 3.7. Simple Links and Cross-References 3.6.5. Abbreviations and Their Expansions 3.13.1. Core Tags for Verse 7.2.5. Speech Contents 4.1.1. Un-numbered Divisions 4.1.2. Numbered Divisions 4.2.1. Headings and Trailers 4.4. Virtual Divisions 14.3.2.3. Personal Relationships 12.3.1.1. Core Elements for Transcriptional Work 17.1.1. Pointers and Links 17.3. Blocks, Segments, and Anchors 13.2. Linking the Apparatus to the Text 23.5.1.2. Defining Content Models: RELAX NG 8.3. Elements Unique to Spoken Texts 24.3.1.3. Modification of Attribute and Attribute Value Lists]
Moduletei
MembresTEI abbr add anchor bibl change cit corr date del desc div divGen figure gloss graphic group head ident idno label lb lg list listBibl milestone name note num pb pc ptr ref reg relatedItem rs s seg table teiCorpus term text time title titlePage titlePart trailer w
Attributs
typecaractérise l'élément en utilisant n'importe quel système ou typologie de classification approprié.
Statut Optionel
Type de données teidata.enumerated
<div type="verse">
 <head>Night in Tarras</head>
 <lg type="stanza">
  <l>At evening tramping on the hot white road</l>
  <l></l>
 </lg>
 <lg type="stanza">
  <l>A wind sprang up from nowhere as the sky</l>
  <l></l>
 </lg>
</div>
subtype(sous-type) fournit une sous-catégorisation de l'élément, si c'est nécessaire.
Statut Optionel
Type de données teidata.enumerated
Note

L'attribut subtype peut être employé pour fournir une sous-classification pour cet élément, en plus de celle fournie par son propre attribut type.

Schematron

<sch:rule context="tei:*[@subtype]">
<sch:assert test="@type">The <sch:name/> element should not be categorized in detail with @subtype unless also categorized in general with @type</sch:assert>
</sch:rule>

att.written

att.written provides attributes to indicate the hand in which the content of an element was written in the source being transcribed. [1.3.1. Attribute Classes]
Moduletei
Membresatt.transcriptional [add del] closer div figure head hi label note opener p postscript salute seg signed stage text trailer
Attributs
handsignale la main de celui qui est intervenue.
Statut Optionel
Type de données teidata.pointer

Schema tei_lite: Datatypes

teidata.certainty

teidata.certainty définit la gamme des valeurs d'attribut exprimant un degré de certitude
Moduletei
Utilisé par
Modèle de contenu
<content>
 <valList type="closed">
  <valItem ident="high"/>
  <valItem ident="medium"/>
  <valItem ident="low"/>
  <valItem ident="unknown"/>
 </valList>
</content>
Declaration
teidata.certainty = "high" | "medium" | "low" | "unknown"
Note

Le degré de certitude peut être exprimé par l'une des valeurs symboliques prédéfinies high, medium, ou low.

teidata.count

teidata.count définit la gamme des valeurs des attributs exprimant une valeur entière et non négative utilisé pour des calculs.
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <dataRef name="nonNegativeInteger"/>
</content>
Declaration
teidata.count = xsd:nonNegativeInteger
Note

Seules des valeurs positives entières sont autorisées.

teidata.duration.iso

teidata.duration.iso définit la gamme de valeurs d'attributs exprimant une durée temporaraire utilisant le norme ISO 8601.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="token"
  restriction="[0-9.,DHMPRSTWYZ/:+\-]+"/>

</content>
Declaration
teidata.duration.iso = token { pattern = "[0-9.,DHMPRSTWYZ/:+\-]+" }
Exemple
<time dur-iso="PT0,75H">trois quarts d'une heure</time>
Exemple
<date dur-iso="P1,5D">une journee et demie</date>
Exemple
<date dur-iso="P14D">une quinzaine</date>
Exemple
<time dur-iso="PT0.02S">20 ms</time>
Note

Une durée est exprimée par une suite de paires alphanumériques, précédée par la lettre P ; la lettre donne l'unité et peut être Y (année), M (mois), D (jour), H (heure), M (minute), ou S (seconde), dans cet ordre. Les nombres sont des entiers sans signe, à l'exception du dernier, qui peut comporter une décimale (en utilisant soit . soit , pour la virgule ; la dernière possibilité est préférable). Si un nombre est 0, alors la paire alphanumérique peut être omise. Si les paires alphanumériques H (heure), M (minute), ou S (seconde) sont présentes, alors le séparateur T doit précéder la première paire alphanumérique ‘time’.

Pour des détails complets, voir ISO 8601 Data elements and interchange formats — Information interchange — Representation of dates and times.

teidata.duration.w3c

teidata.duration.w3c définit la gamme des valeurs d'attributs exprimant une durée temporaraire utilisant les types de données W3C
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="duration"/>
</content>
Declaration
teidata.duration.w3c = xsd:duration
Exemple
<time dur="PT45M">quarante-cinq minutes</time>
Exemple
<date dur="P1DT12H">une journée et demie</date>
Exemple
<date dur="P7D">une semaine</date>
Exemple
<time dur="PT0.02S">20 ms</time>
Note

Une durée est exprimée par une suite de paires alphanumériques, précédée par la lettre P ; la lettre donne l'unité et peut être Y (année), M (mois), D (jour), H (heure), M (minute), ou S (seconde), dans cet ordre. Les nombres sont des entiers non signés à l'exception du dernier, qui peut comporter une décimale (en utilisant soit . soit , pour la virgule ; la dernière possibilité est préférable). Si un nombre est 0, alors la paire alphanumérique peut être omise. Si les paires alphanumériques H (heure), M (minute), ou S (seconde) sont présentes, alors le séparateur T doit précéder la première paire alphanumérique ‘time’.

Pour des détails complets, voir W3C specification.

teidata.enumerated

teidata.enumerated définit la gamme de valeurs des attributs exprimant un nom XML extrait d'une liste de possibilités documentées
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <dataRef key="teidata.word"/>
</content>
Declaration
teidata.enumerated = teidata.word
Note

Les attributs utilisant ce type de données doivent contenir un mot qui suit les règles de définition d'un nom XML valide (voir https://www.w3.org/TR/REC-xml/#dt-name): par exemple ils ne peuvent pas contenir des blancs ni commencer par des chiffres.

Normalement, la liste des possibilités documentées est fournie (ou exemplifiée) par une liste de valeurs dans la spécification de l'attribut associé, exprimée par un élément <valList>.

teidata.language

teidata.language définit la gamme des valeurs d'attributs exprimant une combinaison particulière du langage humain avec un système d'écriture. [6.1. Language Identification]
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <alternate>
  <dataRef name="language"/>
  <valList>
   <valItem ident=""/>
  </valList>
 </alternate>
</content>
Declaration
teidata.language = xsd:language | ( "" )
Note

Les valeurs pour cet attribut sont les ‘étiquettes’ de langue définies dans la norme BCP 47. Actuellement, la norme BCP 47 intègre les normes RFC 4646 et RFC 4647 ; à l'avenir, d'autres documents de l'IETF pourront leur succéder en tant que meilleure pratique.

Une ‘étiquette de langue’, pour la norme BCP 47, est formée par l'assemblage d'une suite de composants ou de sous-étiquettes reliés par un trait d'union (-, U+002D). L'étiquette est composée des sous-étiquettes suivantes, dans l'ordre indiqué. Chaque sous-étiquette est facultative, à l'exception de la première. Chacune ne peut avoir qu'une occurrence, sauf les quatrième et cinquième (variante et extension), qui sont répétables.

langue
Code de langue enregistré par l'IANA. Il est presque toujours identique au code de langue alphabétique ISO 639-2, s'il y en a un. La liste des sous-étiquettes de langue enregistrées est disponible à : https://www.iana.org/assignments/language-subtag-registry. Il est recommandé d'écrire ce code en minuscules.
écriture
Code ISO 15924 pour l'écriture. Ces codes sont constitués de 4 lettres, et il est recommandé d'écrire la première lettre en majuscule, les trois autres en minuscules. La liste canonique des codes est maintenue par le Consortium Unicode, et elle est disponible à : https://unicode.org/iso15924/iso15924-codes.html. L'IETF recommande d'omettre ce code, sauf s'il est nécessaire pour établir une distinction.
région
Soit un code de pays ISO 3166, soit un code de région UN M.49 enregistré par l'IANA (tous les codes de ce type ne sont pas enregistrés : par exemple, ne sont pas enregistrés les codes UN pour des regroupements économiques ou les codes de pays pour lesquels il existe déjà un code de pays alphabétique ISO 3166-2). Le premier est constitué de 2 lettres, et il est recommandé de l'écrire en majuscules. La liste des codes est disponible à : http://www.iso.org/iso/en/prods-services/iso3166ma/02iso-3166-code-lists/index.html. Le second est constitué de 3 chiffres ; la liste des codes est disponible à : http://unstats.un.org/unsd/methods/m49/m49.htm.
variante
Variante enregistrée par l'IANA. Ces codes ‘sont utilisés pour indiquer des variantes additionnelles et bien établies, qui définissent une langue ou ses dialectes et qui ne sont pas couverts par d'autres sous-étiquettes existantes’.
extension
Une extension a la forme d'une lettre unique, suivie d'un trait d'union, lui-même suivi de sous-étiquettes additionnelles. Ces dernières existent pour tenir compte d'une future extension de la norme BCP 47, mais à l'heure actuelle de telles extensions ne sont pas utilisées.
usage privé
Une extension utilisant la sous-étiquette initiale de la lettre x (i.e., commençant par x-) n'a pas d'autre signification que celle négociée entre les parties impliquées. Ces sous-étiquettes doivent être utilisées avec beaucoup de prudence, car elles interfèrent avec l'interopérabilité que l'utilisation de la norme RFC 4646 vise à promouvoir. Pour qu'un document qui utilise ces sous-étiquettes soit conforme à la TEI, un élément language correspondant doit être présent dans l'en-tête TEI.

Il y a deux exceptions au format ci-dessus. Premièrement, il y a des codes de langue dans le registre de l'IANA qui ne correspondent pas à la syntaxe ci-dessus, mais qui sont présents car ils ont été ‘hérités’ de spécifications antérieures.

En second lieu, une étiquette complète de langue peut consister seulement en une sous-étiquette d'usage privé. Ces étiquettes commencent par x- ; il n'est pas nécessaire qu'elles suivent les autres règles établies par l'IETF et acceptées par les présents Principes directeurs. Comme toutes les étiquettes de langue qui utilisent des sous-étiquettes d'usage privé, la langue en question doit être documentée dans un élément correspondant language dans l'en-tête TEI.

Les exemples incluent :

sn
Shona
zh-TW
Taïwanais
zh-Hant-HK
Chinois de Hong Kong écrit dans l'écriture traditionnelle
en-SL
Anglais parlé au Sierra Leone
pl
Polonais
es-MX
Espagnol parlé au Mexique
es-419
Espagnol parlé en Amérique latine

La W3C Internationalization Activity a publié une introduction à la norme BCP 47 dont la lecture peut être utile : Language tags in HTML and XML.

teidata.name

teidata.name définit la gamme des valeurs d'attribut exprimant un nom XML
Moduletei
Utilisé par
att giElément:
Modèle de contenu
<content>
 <dataRef name="Name"/>
</content>
Declaration
teidata.name = xsd:Name
Note

Les attributs utilisant ce type de données doivent contenir un seul mot, qui suit les règles de définition d'un nom XML valide (voir https://www.w3.org/TR/REC-xml/#dt-name) : par exemple ils ne peuvent contenir de blancs ou commencer par des chiffres.

teidata.namespace

teidata.namespace définit la gamme des valeurs d'attributs exprimant une espace de noms XML tels qu'ils sont définis par le W3C.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef restriction="\S+name="anyURI"/>
</content>
Declaration
teidata.namespace = xsd:anyURI { pattern = "\S+" }
Note

La gamme des valeurs syntaxiquement valides est définie par RFC 3986 Uniform Resource Identifier (URI): Generic Syntax.

teidata.numeric

teidata.numeric définit la gamme des valeurs d'attributs utilisées pour des valeurs numériques
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <alternate>
  <dataRef name="double"/>
  <dataRef name="token"
   restriction="(\-?[\d]+/\-?[\d]+)"/>

  <dataRef name="decimal"/>
 </alternate>
</content>
Declaration
teidata.numeric =
   xsd:double | token { pattern = "(\-?[\d]+/\-?[\d]+)" } | xsd:decimal
Note

Toute valeur numérique, représentée en nombre décimal, notée en virgule flottante ou en fraction.

Pour représenter un nombre en virgule flottante, exprimé en notation scientifique, ‘E notation’, une variante de la ‘notation exponentielle’ peut être utilisée. Dans ce format, la valeur est exprimée par deux nombres séparés par la lettre E. Le premier facteur, le significande (parfois appelé mantisse) est donné sous forme décimale, tandis que le second est un entier. La valeur est obtenue en multipliant la mantisse par 10 fois le nombre indiqué par l'entier. Ainsi la valeur représentée en notation décimale 1000.0 pourrait être représentée en notation scientifique 10E3.

Une valeur exprimée en fraction est représentée par deux nombres entiers séparés par une barre oblique (/). Ainsi, la valeur représentée en notation décimale 0.5 pourrait être représentée en fraction par la chaîne de caractères 1/2.

teidata.outputMeasurement

teidata.outputMeasurement définit la gamme de valeurs exprimant les dimensions d'un objet destiné à être affiché
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="token"
  restriction="[\-+]?\d+(\.\d+)?(%|cm|mm|in|pt|pc|px|em|ex|ch|rem|vw|vh|vmin|vmax)"/>

</content>
Declaration
teidata.outputMeasurement =
   token
   {
      pattern = "[\-+]?\d+(\.\d+)?(%|cm|mm|in|pt|pc|px|em|ex|ch|rem|vw|vh|vmin|vmax)"
   }
Exemple
<figure>
 <head>Le logo TEI</head>
 <graphic height="600pxwidth="600px"
  url="http://www.tei-c.org/logos/TEI-600.jpg"/>

</figure>
Note

Ces valeurs peuvent être reportées directement sur des valeurs utilisées par XSL-FO et CSS. Pour les définitions des unités, voir ces spécifications ; à ce jour la liste la plus complète est dans un CSS3 working draft.

teidata.pattern

teidata.pattern définit la gamme des valeurs d'attributs exprimant une expression régulière
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="token"/>
</content>
Declaration
teidata.pattern = token
Note
‘Une expression régulière, souvent appelée modèle, est une expression qui décrit un jeu de chaînes de caractères. Elles sont généralement utilisées pour donner une brève description d'un jeu, sans avoir à en lister tous les éléments. Par exemple, le jeu contenant les trois chaînes de caractères Handel, Händel, et Haendel peut être décrit comme le modèle H(ä|ae?)ndel (ou on peut dire que H(ä|ae?)ndel équivaut à chacune des trois chaînes)’wikipediawikipedia

teidata.pointer

teidata.pointer définit la gamme des valeurs d'attributs utilisées pour fournir un pointeur URI unique sur une autre ressource, soit dans le document courant, soit dans un autre document
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <dataRef restriction="\S+name="anyURI"/>
</content>
Declaration
teidata.pointer = xsd:anyURI { pattern = "\S+" }
Note

La gamme des valeurs valides syntaxiquement est définie parRFC 3986 Uniform Resource Identifier (URI): Generic Syntax

teidata.probability

teidata.probability définit la gamme des valeurs d'attributs exprimant une probabilité.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="double">
  <dataFacet name="minInclusivevalue="0"/>
  <dataFacet name="maxInclusivevalue="1"/>
 </dataRef>
</content>
Declaration
teidata.probability = xsd:double
Note

Le degré de probabilité est exprimé par un nombre réel entre 0 et 1 ; 0 représentant certainement faux et 1 certainement vrai.

teidata.probCert

teidata.probCert defines a range of attribute values which can be expressed either as a numeric probability or as a coded certainty value.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate>
  <dataRef key="teidata.probability"/>
  <dataRef key="teidata.certainty"/>
 </alternate>
</content>
Declaration
teidata.probCert = teidata.probability | teidata.certainty

teidata.replacement

teidata.replacement defines attribute values which contain a replacement template.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <textNode/>
</content>
Declaration
teidata.replacement = text

teidata.temporal.w3c

teidata.temporal.w3c définit la gamme des valeurs d'attributs propre à exprimer une valeur temporelle comme une date, une période, ou une combinaison des deux conformément aux spécifications XML Schema Part 2: Datatypes Second Edition du W3C.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate>
  <dataRef name="date"/>
  <dataRef name="gYear"/>
  <dataRef name="gMonth"/>
  <dataRef name="gDay"/>
  <dataRef name="gYearMonth"/>
  <dataRef name="gMonthDay"/>
  <dataRef name="time"/>
  <dataRef name="dateTime"/>
 </alternate>
</content>
Declaration
teidata.temporal.w3c =
   xsd:date
 | xsd:gYear
 | xsd:gMonth
 | xsd:gDay
 | xsd:gYearMonth
 | xsd:gMonthDay
 | xsd:time
 | xsd:dateTime
Note

S'il est probable que la valeur utilisée doive être comparée à d’autres, alors une indication de fuseau horaire sera toujours incluse, et seule la représentation de dateTime sera employée.

teidata.temporal.working

teidata.temporal.working defines the range of values, conforming to the W3C XML Schema Part 2: Datatypes Second Edition specification, expressing a date or a date and a time within the working life of the document.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate>
  <dataRef name="date"
   restriction="(19[789][0-9]|[2-9][0-9]{3}).*"/>

  <dataRef name="dateTime"
   restriction="(19[789][0-9]|[2-9][0-9]{3}).*"/>

 </alternate>
</content>
Declaration
teidata.temporal.working =
   xsd:date { pattern = "(19[789][0-9]|[2-9][0-9]{3}).*" }
 | xsd:dateTime { pattern = "(19[789][0-9]|[2-9][0-9]{3}).*" }

teidata.text

teidata.text définit la gamme des valeurs d'attributs exprimant une chaine de caracteres Unicode, y compris des espaces blancs.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="string"/>
</content>
Declaration
teidata.text = string

teidata.truthValue

teidata.truthValue définit la gamme des valeurs d'attributs exprimant la vérité d'une proposition.
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <dataRef name="boolean"/>
</content>
Declaration
teidata.truthValue = xsd:boolean
Note

Ce type de données ne s'applique que dans les cas où l'incertitude est inappropriée ; c’est-à-dire si l'attribut concerné peut avoir une valeur autre que vrai ou faux, par ex. inconnu, ou inapplicable, il devrait alors y avoir la version étendue de ce type de données : teidata.xTruthValue.

teidata.unboundedCount

teidata.unboundedCount defines the range of values used for a counting number or the string unbounded for infinity.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate>
  <dataRef name="nonNegativeInteger"/>
  <valList type="closed">
   <valItem ident="unbounded"/>
  </valList>
 </alternate>
</content>
Declaration
teidata.unboundedCount = xsd:nonNegativeInteger | ( "unbounded" )

teidata.version

teidata.version définit la gamme des valeurs d'attribut exprimant un numéro de version TEI.
Moduletei
Utilisé par
Elément:
Modèle de contenu
<content>
 <dataRef name="token"
  restriction="[\d]+(\.[\d]+){0,2}"/>

</content>
Declaration
teidata.version = token { pattern = "[\d]+(\.[\d]+){0,2}" }
Note

La valeur de cet attribut devrait suivre le format proposé par le Consortium Unicode pour identifier les versions (https://unicode.org/versions/). Un numéro de version ne contient que des chiffres et des points. Le numéro initiale identifie le numéro majeur de la version. Un deuxième et un troisième numéro sont aussi disponibles pour la numérotation facultative des versions mineures ou sous-mineurs.

teidata.versionNumber

teidata.versionNumber defines the range of attribute values used for version numbers.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="token"
  restriction="[\d]+[a-z]*[\d]*(\.[\d]+[a-z]*[\d]*){0,3}"/>

</content>
Declaration
teidata.versionNumber =
   token { pattern = "[\d]+[a-z]*[\d]*(\.[\d]+[a-z]*[\d]*){0,3}" }

teidata.word

teidata.word définit la gamme des valeurs d'attributs exprimant un seul mot ou signe
Moduletei
Utilisé par
teidata.enumeratedElément:
Modèle de contenu
<content>
 <dataRef name="token"
  restriction="[^\p{C}\p{Z}]+"/>

</content>
Declaration
teidata.word = token { pattern = "[^\p{C}\p{Z}]+" }
Note

Les attributs employant ce type de données doivent contenir un ‘mot’ simple ne contenant que des lettres, des chiffres, des signes de ponctuation, ou des symboles : ils ne peuvent donc pas inclure d’espace.

teidata.xmlName

teidata.xmlName defines attribute values which contain an XML name.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <dataRef name="NCName"/>
</content>
Declaration
teidata.xmlName = xsd:NCName

teidata.xpath

teidata.xpath defines attribute values which contain an XPath expression.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <textNode/>
</content>
Declaration
teidata.xpath = text

teidata.xTruthValue

teidata.xTruthValue (extended truth value) définit la gamme des valeurs d'attributs exprimant une vérité potentiellement inconnue.
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate>
  <dataRef name="boolean"/>
  <valList>
   <valItem ident="unknown"/>
   <valItem ident="inapplicable"/>
  </valList>
 </alternate>
</content>
Declaration
teidata.xTruthValue = xsd:boolean | ( "unknown" | "inapplicable" )
Note

Dans le cas où l'incertitude n’est pas adaptée, employer plutot le type de données teidata.TruthValue.

Schema tei_lite: Macros

macro.limitedContent

macro.limitedContent (contenu du paragraphe) définit le contenu des éléments textuels qui ne sont pas utilisés pour la transcription des contenus existants. [1.3. The TEI Class System]
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.limitedPhrase"/>
  <classRef key="model.inter"/>
 </alternate>
</content>
Declaration
macro.limitedContent = ( text | model.limitedPhrase | model.inter )*

macro.paraContent

macro.paraContent (contenu de paragraphe.) définit le contenu de paragraphes et d' éléments semblables. [1.3. The TEI Class System]
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.paraPart"/>
 </alternate>
</content>
Declaration
macro.paraContent = ( text | model.paraPart )*

macro.phraseSeq

macro.phraseSeq (suite de syntagmes.) définit un ordre de données et d'éléments syntagmatiques. [1.4.1. Standard Content Models]
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.attributable"/>
  <classRef key="model.phrase"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Declaration
macro.phraseSeq =
   ( text | model.gLike | model.attributable | model.phrase | model.global )*

macro.phraseSeq.limited

macro.phraseSeq.limited (séquence d'expression délimitée) définit un ordre de données de caractère et ces éléments de niveau d'expression qui ne sont pas typiquement utilisées pour transcrire des documents existants. [1.4.1. Standard Content Models]
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.limitedPhrase"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Declaration
macro.phraseSeq.limited = ( text | model.limitedPhrase | model.global )*

macro.specialPara

macro.specialPara (contenu "spécial" de paragraphe) définit le modèle de contenu des éléments tels que des notes ou des items de liste, contenant soit une suite d'éléments de niveau composant soit qui ont la même structure qu'un paragraphe, contenant une suite d’éléments du niveau de l’expression et de niveau intermédiaire. [1.3. The TEI Class System]
Moduletei
Utilisé par
Modèle de contenu
<content>
 <alternate minOccurs="0"
  maxOccurs="unbounded">

  <textNode/>
  <classRef key="model.gLike"/>
  <classRef key="model.phrase"/>
  <classRef key="model.inter"/>
  <classRef key="model.divPart"/>
  <classRef key="model.global"/>
 </alternate>
</content>
Declaration
macro.specialPara =
   (
      text
    | model.gLikemodel.phrasemodel.intermodel.divPartmodel.global
   )*
Notes
1
La version originelle de ce tutoriel contient un exemple du roman Jane Eyre dans une édition anglaise du XIXème siecle ; nous présentons ce même passage retrouvé dans une traduction francaise de la même période. Pour la plupart des autres exemplaires, par contre, nous avons tenté de retrouver un texte d'origine française.
2
Un espace de noms est un concept XML. Son rôle est d’identifier le vocabulaire à partir duquel un ensemble d’éléments sont conçus. Pour ce faire, on utilise un identifiant standard, qui ressemble à une adresse web. L’espace de noms pour tous les éléments TEI est : http://www.tei-c.org/ns/1.0.
3
Extrait du Dit du Vieux Marin de Samuel Taylor Coleridge, traduction francaise de Marianne van Hirtum (1965)
4
Extrait du Gamiani ou Deux nuits d’excès de Alfred de Musset (1833)
5
Nous avons trouvé cette phrase sur un page web de l'ENSSIB http://bbf.enssib.fr/consulter/bbf-2012-05-0006-001
6
Extrait d'une traduction du Red Headed League de A. Conan Doyle, http://fr.wikisource.org/wiki/Page:Doyle_-_Nouvelles_Aventures_de_Sherlock_Holmes.djvu/6.
7
La norme pertinente est Best Current Practice 47 (http://tools.ietf.org/html/bcp47). La liste faisant autorité des sous-étiquettes est maintenue par IANA et est disponible à : http://www.iana.org/assignments/language-subtag-registry.Pour un panorama général sur la construction des étiquettes de noms de langue, voir http://www.w3.org/International/articles/language-tags/, et pour un guide pratique, voir :see http://www.w3.org/International/questions/qa-choosing-language-tags.
8
Georges Perec, Espèces d'espaces, 1974.
9
Extrait du Dit du Vieux Marin de Samuel Taylor Coleridge, traduction francaise de Marianne van Hirtum (1965)
10
Une explication complète de ce terme, défini par le W3C (le consortium qui gère le développement et la maintenance du web), excède les objectifs de ce tutoriel. Cependant, la forme d’URI la plus fréquemment rencontrée est celle familière de l’URL, utilisée pour identifier une page web, telle que http://www.tei-c.org/index.xml.
11
La phrase est prise du journal L'est Republican (edition de 1999-05-19)
12
Extrait de La vie mode d'emploi de Georges Perec (1978)
13
Titre dans Libération du 7 fev 2012
14
Extrait de À l'ombre des jeunes filles en fleurs de Marcel Proust
15
Extrait de La petite Dorrit de Charles Dickens
16
Extrait de La vie mode d'emploi de Georges Perec (1978)
17
Michel Foucault, citant une liste de Borges tirée d'une « certaine encyclopédie chinoise», dans Les Mots et les choses (1966).
18
Extrait d'une notice sur Eugene Ionesco http://fr.wikipedia.org/wiki/Eug%C3%A8ne_Ionesco
19
L’analyse, légèrement simplifiée, a été empruntée, avec leur autorisation, à Willard McCarty et Burton Wright, An Analytical Onomasticon to the Metamorphoses of Ovid.
Lou Burnard et C.M. Sperberg-McQueen. Date: Paris, avril 2013