I SO Y N Easy TMF - termsciences.fr

Post on 17-Jun-2022

2 views 0 download

Transcript of I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide 1Isabelle.kramer@loria.fr

Easy TMF

Document établi à partir des tutoriaux TMFprespar{1,2,3}.ppt de Laurent ROMARY, disponibles sur TMFpage :http://www.loria.fr/projets/TMF/

Tout ce que vous avez toujours voulu savoir sur TMF…

I SOYNTAX

Slide 2Isabelle.kramer@loria.fr

Les enjeux de la normalisation

• Eviter des difficultés de compréhension dans des secteursd’activité technique

• Faire reconnaître des procédés (ou produits) et les termes qui lesdénomment

• Promouvoir un savoir, une compétence

• Permettre des échanges de données

• Contribuer à l’évaluation des travaux effectués dans un mêmedomaine

Avant-propos

I SOYNTAX

Slide 3Isabelle.kramer@loria.fr

Petit lexique

• TMF: Terminological Mark-up Framework• Définition des structures sous-jacentes et des mécanismes nécessaires à la

représentation computationnelle des données terminologiques

• Indépendant d’un quelconque format

• GMT: Generic Mapping Tool• Format XML concis pour décrire la structure du modèle du TMF

• TML: Terminological Mark-up Language• Un format de représentation spécifique compatible TMF

• DCR : Data Category Registry• Registre de catégories de données

• DCS : Data Category Selection• Sélection de catégories de données pour une application donnée

Avant-propos

I SOYNTAX

Slide 4Isabelle.kramer@loria.fr

Le Métamodèle

Représentation de la structure

sous-jacente de données terminologiques

I SOYNTAX

Slide 5Isabelle.kramer@loria.fr

À l’origine de TMF…

• Exprimer des contraintes sur la représentation desterminologies computationnelles

• Quelle structure sous-jacente pour ces terminologies?

• Quelle catégorie de données utilisée et dans quelle condition?

• Permettre une interopérabilité entre lesterminologies

• Proposer un outil conceptuel pour comparer différents formats

TMF

I SOYNTAX

Slide 6Isabelle.kramer@loria.fr

Introduction à TMF

• Une plate-forme unifiée de représentation dedonnées terminologiques multilingues

• Des méta-contraintes applicables à touteapplication XML pour le marquageterminologique.

TMF

I SOYNTAX

Slide 7Isabelle.kramer@loria.fr

Du concept au terme

Base terminologique

Informations conceptuelles concept a concept b concept n

Réalisations linguistiques langue 1 langue 2 langue 3 langue 2

Informations lexicales terme 1 terme 2 terme 3 terme 4 terme 5

Ë Un concept sera décrit en diverses langues et désigné par n termes danschaque langue

TMF

I SOYNTAX

Slide 8Isabelle.kramer@loria.fr

Une organisation systématique et claireTMF

I SOYNTAX

Slide 9Isabelle.kramer@loria.fr

Les niveaux du méta-modèle (1/2)

• Terminological Data Collection (TDC)– Une collection de données contenant des informations sur

les concepts dans un domaine spécifique.

• Terminological Entry (TE)– Une entrée contient des informations sur des unités

terminologiques.

» E.g. Domain description, C !onceptual relations etc.

Méta-modèle

I SOYNTAX

Slide 10Isabelle.kramer@loria.fr

• Language Section (LS)• Une section de l’entrée terminologique contenant des

informations relatives à la langue

• Term Section (TS)• Fournit des informations sur le terme

» E.g. Term status (e.g. abbreviation), Usage information(temporal, geographical etc.)

• Term Component Section (TCS)• Fournit des informations sur les éléments d’un terme

» E.g. Component grammatical information (Part of speech)

Méta-modèle

Les niveaux du méta-modèle (2/2)

I SOYNTAX

Slide 11Isabelle.kramer@loria.fr

Usage des catégories de données

I SOYNTAX

Slide 12Isabelle.kramer@loria.fr

Qu’est ce qu’une catégorie dedonnées?

• Elément d’information qui permet de structurer et d’enrichir lesdonnées.

• Le registre de catégories de données (DCR) constitue donc unréférentiel entre plusieurs applications permettant d’assurerl’interopérabilité des données entre différentes terminologies

• peut être assimilée à une étiquette permettant de décrire l’entréeterminologique.

– porteuse d’information

I SOYNTAX

Slide 13Isabelle.kramer@loria.fr

• Une catégorie de données est définie pardifférents éléments– Identifiant– Définition, avec sa source– Niveau(x) d’ancrage

/definition/Nom definitionDéfinition A representation of a concept by a

descriptive statement which serves todifferentiate it from relatedconcepts.

Source ISO12620Levels TE , LS , TS

I SOYNTAX

Slide 14Isabelle.kramer@loria.fr

Terme préféré

• Notion très utilisé en indexation

• Défintion : « A term rated according to thescale of a term acceptability rating as theprimary term for a given concept »

• Il est préférable de n’avoir qu’un seul terme préféré parentrée terminologique

I SOYNTAX

Slide 15Isabelle.kramer@loria.fr

Illustration par l’exemple<struct type=“terminologicalEntry”>

<feat type=“identifier”>C675</feat>

<feat type=“definition” xml:lang=“fr”>la formation...</feat>

<struct type=“languageSection”>

<feat type=“languageIdentifier”>fr</feat>

<struct type=“termSection”>

<feat type=“term”>formation à distance</feat>

<feat type=“administrationStatus”>preferredTerm</feat>

<feat type=“identifier”>T243</feat>

</struct>

<struct type=“termSection”>

<feat type=“term”>enseignement à distance</feat>

<feat type=“identifier”>T46</feat>

</struct>

</struct>

</struct>

I SOYNTAX

Slide 16Isabelle.kramer@loria.fr

Langue Objet et langue de travail

I SOYNTAX

Slide 17Isabelle.kramer@loria.fr

Langue objet et langue de travail

• Langue objet :• identifie la langue dont on parle (information terminologique)

• Language section

• Langue de travail :• dans laquelle on parle (descriptions linguistiques)

• xml:lang

ËLe terme est le point de rencontre entre la langue objet et la langue detravail

• appartient à un bloc langue (Langue Objet)

• est décrit dans une langue donnée (Lange de Travail)

Langue objet & langue de travail

I SOYNTAX

Slide 18Isabelle.kramer@loria.fr

TERMINOLOGICAL ENTRY

/definition/ xml:lang=“fr“Membre de l'équipage d'un vaisseau spatial

LANGUAGE SECTION franfranççaisaisTERM SECTION

/term/ astronaute

TERM SECTION/term/ cosmonaute

TERM SECTION/term/ spationaute

LANGUAGE SECTION anglaisanglaisTERM SECTION

/term/ astronaut

TERM SECTION/term/ cosmonaut

Exemple d’astronomique

Langue objet & langue de travail

LS = langue objetLangue de travail

I SOYNTAX

Slide 19Isabelle.kramer@loria.fr

GMT

Generic Mapping Tool

I SOYNTAX

Slide 20Isabelle.kramer@loria.fr

GMT• Représentation XML abstraite

• Identification des niveaux<struct type=“LS”>…</struct>

• Représentation des catégories de données<feat type=“definition”>…</feat>

• Pour compléter une information donnée– Le second trait raffine le premier:<brack>

<feat type=“classificationCode“>xxx</feat><feat type=“classificationSystem“>Lenoc</feat>

</brack>

GMT

I SOYNTAX

Slide 21Isabelle.kramer@loria.fr

TERMINOLOGICAL ENTRY

/definition/ xml:lang=“fr“

Membre de l'équipage d'un vaisseau spatial

LANGUAGE SECTION

/language Identifier/=“français“TERM SECTION astronauteTERM SECTION cosmonauteTERM SECTION spationaute

LANGUAGE SECTION

/language Identifier/=“anglais“TERM SECTION astronautTERM SECTION cosmonaut

Exemple d’astronomique

GMT

I SOYNTAX

Slide 22Isabelle.kramer@loria.fr

<struct type="terminologicalEntry">

<feat type="definition!» xml:lang=“fr“>Membre …</feat>

<struct type="languageSection">

<feat type="languageIdentifier">en</feat>

<struct type="termSection">

<feat type="term">astronaut</feat>

</struct>

<struct type="termSection">

<feat type="term">cosmonaut</feat>

</struct>

</struct>

<struct type="LanguageSection">

<feat type="languageIdentifier">fr</feat>

<struct type="termSection">

<feat type="term">astronaute</feat>

</struct>

<struct type="termSection">

<feat type="term">cosmonaute</feat>

</struct>

….

</struct>

</struct>

GMT : comment ça marche?

I SOYNTAX

Slide 23Isabelle.kramer@loria.fr

<struct type="LanguageSection"><feat type="languageIdentifier">fr</feat><struct type="termSection">

<feat type="term">astronaute</feat></struct><struct type="termSection">

<feat type="term">cosmonaute</feat></struct><struct type="termSection">

<feat type="term">spationaute</feat></struct></struct>

</struct>

GMT : comment ça marche?

I SOYNTAX

Slide 24Isabelle.kramer@loria.fr

L’interopérabilité

Comment ça marche en VRAI?

I SOYNTAX

Slide 25Isabelle.kramer@loria.fr

Introduction

• Principe d’interopérabilité– Si 2 TMLs possédent le même DCS, même si elles

différent radicalement dans le style et le vocabulaire,elles sont équivalentes.

ËIl est donc toujours possible d’établir un filtre pourpasser d’une TML à une autre, si elles sontintéroperables.

Ë GMT est le moyen de représentation pour le faire

GMT

I SOYNTAX

Slide 26Isabelle.kramer@loria.fr

Intéropérabilité des données

TMF

TML1 TML2 TML3 TMLi…

(TBX)(Geneter)

GMT

TMF

I SOYNTAX

Slide 27Isabelle.kramer@loria.fr

L’interopérabilité

Illustration par l’exemple

I SOYNTAX

Slide 28Isabelle.kramer@loria.fr

MARTIF-MSC example<termEntry id='ID67'>

<descrip type='subjectField‘>manufacturing</descrip>

<descrip type='definition'>A value between 0 and 1 used in...</descrip>

<langSet lang='en'>

<tig>

<term>alpha smoothing factor</term>

<termNote type='termType'>fullForm</termNote>

</tig>

</langSet>

<langSet lang='hu'>

<tig>

<term>Alfa ...</term>

</tig>

</langSet>

</termEntry>

I SOYNTAX

Slide 29Isabelle.kramer@loria.fr

Repérage et typage de l’information

TE

LS

TS

id=‘ID67’ [attribute]subjectField=‘!manufacturing!’ [typedElement]

definition=‘A value…’ [typedElement]

languageIdentifier =‘!hu!’ [attribute]

languageIdentifier =‘!en!’ [attribute]

term=‘…’ [element]

term=‘alpha smoothing factor’ [element]

termType=‘fullForm’ [typedElement]

tig

langSet

tig

langSet

termEntry

I SOYNTAX

Slide 30Isabelle.kramer@loria.fr

Vers TMF

TE

TS

LSLS

TS

id=‘ID67’subjectField=‘!manufacturing!’

definition=‘A value…’

languageIdentifier =‘!hu!’languageIdentifier =‘!en!’

term=‘…’term=‘alpha smoothing factor’

termType=‘fullForm’

I SOYNTAX

Slide 31Isabelle.kramer@loria.fr

TMF<struct type=“TermEntry”>

<feat type=“id”>ID67</feat>

<feat type=“subjectField”>manufacturing</feat>

<feat type=“definition”>A value between 0 and 1 used in ...</feat>

<struct type=“LanguageSection”>

<feat type=“languageIdentifier”>en</feat>

<struct type=“TermSection”>

<feat type=“term”>alpha smoothing factor</feat>

<feat type=“termType”>fullForm</feat>

</struct>

</struct>

<struct type=“LanguageSection”>

<feat type=“languageIdentifier”>hu</feat>

<struct type=“TermSection”>

<feat type=“term”>Alfa ...</feat>

</struct>

</struct>

</struct>

I SOYNTAX

Slide 32Isabelle.kramer@loria.fr

Etablir des liens en GMT?

• La section Global Information va permettred’héberger l’information relative au lienqu’il soit

• En locale, c’est-à-dire au sein d’un même fichier

• Externe

• Utilisation de la technologie Xlink

I SOYNTAX

Slide 33Isabelle.kramer@loria.fr

Terminological Data Collection

Global information Complementary information

terminologicalEntry terminologicalEntry terminologicalEntry

languageSection languageSection languageSection languageSection

termSection termSection termSection termSection termSection

TMF et les liens

ressources

A pour terme générique

Est l’abréviation de

I SOYNTAX

Slide 34Isabelle.kramer@loria.fr

Déclaration d’une ressource

<struct type=“globalInformation”><link type=“locator”>

<feat type=“label”>fichier courant</feat><feat type=“title”>…</feat><feat type=“uri”>URI du fichier courant</feat>

</link></struct>

I SOYNTAX

Slide 35Isabelle.kramer@loria.fr

Établissement du lien<struct type="terminologicalEntry">

<struct type="languageSection">

<feat type="languageIdentifier">fr</feat>

<struct type="termSection">

<feat type="term">formation à distance</feat>

<feat type="identifier">T243</feat>

</struct>

<struct type="termSection">

<feat type="term">FAD</feat>

<feat type="identifier">T108</feat>

<link type="arc">

<feat type="locator">exemplierMSH220205.xml</feat>

<feat type="label">shortFormFor</feat>

<feat type="to">T243</feat>

</link>

</struct>

…</struct>

</struct>

I SOYNTAX

Slide 36Isabelle.kramer@loria.fr

Quelques liens utiles

• SALT project– http://www.ttt.org/

• The TMF site– http://www.loria.fr/projets/TMF

• The Syntax site– http://www.syntax.inist.fr