I SO Y N Easy TMF - termsciences.fr
Transcript of I SO Y N Easy TMF - termsciences.fr
I SOYNTAX
Slide [email protected]
Easy TMF
Document établi à partir des tutoriaux TMFprespar{1,2,3}.ppt de Laurent ROMARY, disponibles sur TMFpage :http://www.loria.fr/projets/TMF/
Tout ce que vous avez toujours voulu savoir sur TMF…
I SOYNTAX
Slide [email protected]
Les enjeux de la normalisation
• Eviter des difficultés de compréhension dans des secteursd’activité technique
• Faire reconnaître des procédés (ou produits) et les termes qui lesdénomment
• Promouvoir un savoir, une compétence
• Permettre des échanges de données
• Contribuer à l’évaluation des travaux effectués dans un mêmedomaine
Avant-propos
I SOYNTAX
Slide [email protected]
Petit lexique
• TMF: Terminological Mark-up Framework• Définition des structures sous-jacentes et des mécanismes nécessaires à la
représentation computationnelle des données terminologiques
• Indépendant d’un quelconque format
• GMT: Generic Mapping Tool• Format XML concis pour décrire la structure du modèle du TMF
• TML: Terminological Mark-up Language• Un format de représentation spécifique compatible TMF
• DCR : Data Category Registry• Registre de catégories de données
• DCS : Data Category Selection• Sélection de catégories de données pour une application donnée
Avant-propos
I SOYNTAX
Slide [email protected]
Le Métamodèle
Représentation de la structure
sous-jacente de données terminologiques
I SOYNTAX
Slide [email protected]
À l’origine de TMF…
• Exprimer des contraintes sur la représentation desterminologies computationnelles
• Quelle structure sous-jacente pour ces terminologies?
• Quelle catégorie de données utilisée et dans quelle condition?
• Permettre une interopérabilité entre lesterminologies
• Proposer un outil conceptuel pour comparer différents formats
TMF
I SOYNTAX
Slide [email protected]
Introduction à TMF
• Une plate-forme unifiée de représentation dedonnées terminologiques multilingues
• Des méta-contraintes applicables à touteapplication XML pour le marquageterminologique.
TMF
I SOYNTAX
Slide [email protected]
Du concept au terme
Base terminologique
Informations conceptuelles concept a concept b concept n
Réalisations linguistiques langue 1 langue 2 langue 3 langue 2
Informations lexicales terme 1 terme 2 terme 3 terme 4 terme 5
Ë Un concept sera décrit en diverses langues et désigné par n termes danschaque langue
TMF
I SOYNTAX
Slide [email protected]
Les niveaux du méta-modèle (1/2)
• Terminological Data Collection (TDC)– Une collection de données contenant des informations sur
les concepts dans un domaine spécifique.
• Terminological Entry (TE)– Une entrée contient des informations sur des unités
terminologiques.
» E.g. Domain description, C !onceptual relations etc.
Méta-modèle
I SOYNTAX
Slide [email protected]
• Language Section (LS)• Une section de l’entrée terminologique contenant des
informations relatives à la langue
• Term Section (TS)• Fournit des informations sur le terme
» E.g. Term status (e.g. abbreviation), Usage information(temporal, geographical etc.)
• Term Component Section (TCS)• Fournit des informations sur les éléments d’un terme
» E.g. Component grammatical information (Part of speech)
Méta-modèle
Les niveaux du méta-modèle (2/2)
I SOYNTAX
Slide [email protected]
Qu’est ce qu’une catégorie dedonnées?
• Elément d’information qui permet de structurer et d’enrichir lesdonnées.
• Le registre de catégories de données (DCR) constitue donc unréférentiel entre plusieurs applications permettant d’assurerl’interopérabilité des données entre différentes terminologies
• peut être assimilée à une étiquette permettant de décrire l’entréeterminologique.
– porteuse d’information
I SOYNTAX
Slide [email protected]
• Une catégorie de données est définie pardifférents éléments– Identifiant– Définition, avec sa source– Niveau(x) d’ancrage
/definition/Nom definitionDéfinition A representation of a concept by a
descriptive statement which serves todifferentiate it from relatedconcepts.
Source ISO12620Levels TE , LS , TS
I SOYNTAX
Slide [email protected]
Terme préféré
• Notion très utilisé en indexation
• Défintion : « A term rated according to thescale of a term acceptability rating as theprimary term for a given concept »
• Il est préférable de n’avoir qu’un seul terme préféré parentrée terminologique
I SOYNTAX
Slide [email protected]
Illustration par l’exemple<struct type=“terminologicalEntry”>
<feat type=“identifier”>C675</feat>
<feat type=“definition” xml:lang=“fr”>la formation...</feat>
<struct type=“languageSection”>
<feat type=“languageIdentifier”>fr</feat>
<struct type=“termSection”>
<feat type=“term”>formation à distance</feat>
<feat type=“administrationStatus”>preferredTerm</feat>
<feat type=“identifier”>T243</feat>
</struct>
<struct type=“termSection”>
<feat type=“term”>enseignement à distance</feat>
<feat type=“identifier”>T46</feat>
</struct>
</struct>
</struct>
I SOYNTAX
Slide [email protected]
Langue objet et langue de travail
• Langue objet :• identifie la langue dont on parle (information terminologique)
• Language section
• Langue de travail :• dans laquelle on parle (descriptions linguistiques)
• xml:lang
ËLe terme est le point de rencontre entre la langue objet et la langue detravail
• appartient à un bloc langue (Langue Objet)
• est décrit dans une langue donnée (Lange de Travail)
Langue objet & langue de travail
I SOYNTAX
Slide [email protected]
TERMINOLOGICAL ENTRY
/definition/ xml:lang=“fr“Membre de l'équipage d'un vaisseau spatial
LANGUAGE SECTION franfranççaisaisTERM SECTION
/term/ astronaute
TERM SECTION/term/ cosmonaute
TERM SECTION/term/ spationaute
LANGUAGE SECTION anglaisanglaisTERM SECTION
/term/ astronaut
TERM SECTION/term/ cosmonaut
Exemple d’astronomique
Langue objet & langue de travail
LS = langue objetLangue de travail
I SOYNTAX
Slide [email protected]
GMT• Représentation XML abstraite
• Identification des niveaux<struct type=“LS”>…</struct>
• Représentation des catégories de données<feat type=“definition”>…</feat>
• Pour compléter une information donnée– Le second trait raffine le premier:<brack>
<feat type=“classificationCode“>xxx</feat><feat type=“classificationSystem“>Lenoc</feat>
</brack>
GMT
I SOYNTAX
Slide [email protected]
TERMINOLOGICAL ENTRY
/definition/ xml:lang=“fr“
Membre de l'équipage d'un vaisseau spatial
LANGUAGE SECTION
/language Identifier/=“français“TERM SECTION astronauteTERM SECTION cosmonauteTERM SECTION spationaute
LANGUAGE SECTION
/language Identifier/=“anglais“TERM SECTION astronautTERM SECTION cosmonaut
Exemple d’astronomique
GMT
I SOYNTAX
Slide [email protected]
<struct type="terminologicalEntry">
<feat type="definition!» xml:lang=“fr“>Membre …</feat>
<struct type="languageSection">
<feat type="languageIdentifier">en</feat>
<struct type="termSection">
<feat type="term">astronaut</feat>
</struct>
<struct type="termSection">
<feat type="term">cosmonaut</feat>
</struct>
</struct>
<struct type="LanguageSection">
<feat type="languageIdentifier">fr</feat>
<struct type="termSection">
<feat type="term">astronaute</feat>
</struct>
<struct type="termSection">
<feat type="term">cosmonaute</feat>
</struct>
….
</struct>
</struct>
GMT : comment ça marche?
I SOYNTAX
Slide [email protected]
<struct type="LanguageSection"><feat type="languageIdentifier">fr</feat><struct type="termSection">
<feat type="term">astronaute</feat></struct><struct type="termSection">
<feat type="term">cosmonaute</feat></struct><struct type="termSection">
<feat type="term">spationaute</feat></struct></struct>
</struct>
GMT : comment ça marche?
I SOYNTAX
Slide [email protected]
Introduction
• Principe d’interopérabilité– Si 2 TMLs possédent le même DCS, même si elles
différent radicalement dans le style et le vocabulaire,elles sont équivalentes.
ËIl est donc toujours possible d’établir un filtre pourpasser d’une TML à une autre, si elles sontintéroperables.
Ë GMT est le moyen de représentation pour le faire
GMT
I SOYNTAX
Slide [email protected]
Intéropérabilité des données
TMF
TML1 TML2 TML3 TMLi…
(TBX)(Geneter)
GMT
TMF
I SOYNTAX
Slide [email protected]
MARTIF-MSC example<termEntry id='ID67'>
<descrip type='subjectField‘>manufacturing</descrip>
<descrip type='definition'>A value between 0 and 1 used in...</descrip>
<langSet lang='en'>
<tig>
<term>alpha smoothing factor</term>
<termNote type='termType'>fullForm</termNote>
</tig>
</langSet>
<langSet lang='hu'>
<tig>
<term>Alfa ...</term>
</tig>
</langSet>
</termEntry>
I SOYNTAX
Slide [email protected]
Repérage et typage de l’information
TE
LS
TS
id=‘ID67’ [attribute]subjectField=‘!manufacturing!’ [typedElement]
definition=‘A value…’ [typedElement]
languageIdentifier =‘!hu!’ [attribute]
languageIdentifier =‘!en!’ [attribute]
term=‘…’ [element]
term=‘alpha smoothing factor’ [element]
termType=‘fullForm’ [typedElement]
tig
langSet
tig
langSet
termEntry
I SOYNTAX
Slide [email protected]
Vers TMF
TE
TS
LSLS
TS
id=‘ID67’subjectField=‘!manufacturing!’
definition=‘A value…’
languageIdentifier =‘!hu!’languageIdentifier =‘!en!’
term=‘…’term=‘alpha smoothing factor’
termType=‘fullForm’
I SOYNTAX
Slide [email protected]
TMF<struct type=“TermEntry”>
<feat type=“id”>ID67</feat>
<feat type=“subjectField”>manufacturing</feat>
<feat type=“definition”>A value between 0 and 1 used in ...</feat>
<struct type=“LanguageSection”>
<feat type=“languageIdentifier”>en</feat>
<struct type=“TermSection”>
<feat type=“term”>alpha smoothing factor</feat>
<feat type=“termType”>fullForm</feat>
</struct>
</struct>
<struct type=“LanguageSection”>
<feat type=“languageIdentifier”>hu</feat>
<struct type=“TermSection”>
<feat type=“term”>Alfa ...</feat>
</struct>
</struct>
</struct>
I SOYNTAX
Slide [email protected]
Etablir des liens en GMT?
• La section Global Information va permettred’héberger l’information relative au lienqu’il soit
• En locale, c’est-à-dire au sein d’un même fichier
• Externe
• Utilisation de la technologie Xlink
I SOYNTAX
Slide [email protected]
Terminological Data Collection
Global information Complementary information
terminologicalEntry terminologicalEntry terminologicalEntry
languageSection languageSection languageSection languageSection
termSection termSection termSection termSection termSection
TMF et les liens
ressources
A pour terme générique
Est l’abréviation de
I SOYNTAX
Slide [email protected]
Déclaration d’une ressource
<struct type=“globalInformation”><link type=“locator”>
<feat type=“label”>fichier courant</feat><feat type=“title”>…</feat><feat type=“uri”>URI du fichier courant</feat>
</link></struct>
I SOYNTAX
Slide [email protected]
Établissement du lien<struct type="terminologicalEntry">
<struct type="languageSection">
<feat type="languageIdentifier">fr</feat>
<struct type="termSection">
<feat type="term">formation à distance</feat>
<feat type="identifier">T243</feat>
</struct>
<struct type="termSection">
<feat type="term">FAD</feat>
<feat type="identifier">T108</feat>
<link type="arc">
<feat type="locator">exemplierMSH220205.xml</feat>
<feat type="label">shortFormFor</feat>
<feat type="to">T243</feat>
</link>
</struct>
…</struct>
</struct>
I SOYNTAX
Slide [email protected]
Quelques liens utiles
• SALT project– http://www.ttt.org/
• The TMF site– http://www.loria.fr/projets/TMF
• The Syntax site– http://www.syntax.inist.fr