I SO Y N Easy TMF - termsciences.fr

36
I SO Y N T A X Slide 1 [email protected] Easy TMF Document établi à partir des tutoriaux TMFprespar{1,2,3}.ppt de Laurent ROMARY, disponibles sur TMFpage : http://www.loria.fr/projets/TMF/ Tout ce que vous avez toujours voulu savoir sur TMF…

Transcript of I SO Y N Easy TMF - termsciences.fr

Page 1: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Easy TMF

Document établi à partir des tutoriaux TMFprespar{1,2,3}.ppt de Laurent ROMARY, disponibles sur TMFpage :http://www.loria.fr/projets/TMF/

Tout ce que vous avez toujours voulu savoir sur TMF…

Page 2: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Les enjeux de la normalisation

• Eviter des difficultés de compréhension dans des secteursd’activité technique

• Faire reconnaître des procédés (ou produits) et les termes qui lesdénomment

• Promouvoir un savoir, une compétence

• Permettre des échanges de données

• Contribuer à l’évaluation des travaux effectués dans un mêmedomaine

Avant-propos

Page 3: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Petit lexique

• TMF: Terminological Mark-up Framework• Définition des structures sous-jacentes et des mécanismes nécessaires à la

représentation computationnelle des données terminologiques

• Indépendant d’un quelconque format

• GMT: Generic Mapping Tool• Format XML concis pour décrire la structure du modèle du TMF

• TML: Terminological Mark-up Language• Un format de représentation spécifique compatible TMF

• DCR : Data Category Registry• Registre de catégories de données

• DCS : Data Category Selection• Sélection de catégories de données pour une application donnée

Avant-propos

Page 4: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Le Métamodèle

Représentation de la structure

sous-jacente de données terminologiques

Page 5: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

À l’origine de TMF…

• Exprimer des contraintes sur la représentation desterminologies computationnelles

• Quelle structure sous-jacente pour ces terminologies?

• Quelle catégorie de données utilisée et dans quelle condition?

• Permettre une interopérabilité entre lesterminologies

• Proposer un outil conceptuel pour comparer différents formats

TMF

Page 6: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Introduction à TMF

• Une plate-forme unifiée de représentation dedonnées terminologiques multilingues

• Des méta-contraintes applicables à touteapplication XML pour le marquageterminologique.

TMF

Page 7: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Du concept au terme

Base terminologique

Informations conceptuelles concept a concept b concept n

Réalisations linguistiques langue 1 langue 2 langue 3 langue 2

Informations lexicales terme 1 terme 2 terme 3 terme 4 terme 5

Ë Un concept sera décrit en diverses langues et désigné par n termes danschaque langue

TMF

Page 8: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Une organisation systématique et claireTMF

Page 9: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Les niveaux du méta-modèle (1/2)

• Terminological Data Collection (TDC)– Une collection de données contenant des informations sur

les concepts dans un domaine spécifique.

• Terminological Entry (TE)– Une entrée contient des informations sur des unités

terminologiques.

» E.g. Domain description, C !onceptual relations etc.

Méta-modèle

Page 10: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

• Language Section (LS)• Une section de l’entrée terminologique contenant des

informations relatives à la langue

• Term Section (TS)• Fournit des informations sur le terme

» E.g. Term status (e.g. abbreviation), Usage information(temporal, geographical etc.)

• Term Component Section (TCS)• Fournit des informations sur les éléments d’un terme

» E.g. Component grammatical information (Part of speech)

Méta-modèle

Les niveaux du méta-modèle (2/2)

Page 11: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Usage des catégories de données

Page 12: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Qu’est ce qu’une catégorie dedonnées?

• Elément d’information qui permet de structurer et d’enrichir lesdonnées.

• Le registre de catégories de données (DCR) constitue donc unréférentiel entre plusieurs applications permettant d’assurerl’interopérabilité des données entre différentes terminologies

• peut être assimilée à une étiquette permettant de décrire l’entréeterminologique.

– porteuse d’information

Page 13: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

• Une catégorie de données est définie pardifférents éléments– Identifiant– Définition, avec sa source– Niveau(x) d’ancrage

/definition/Nom definitionDéfinition A representation of a concept by a

descriptive statement which serves todifferentiate it from relatedconcepts.

Source ISO12620Levels TE , LS , TS

Page 14: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Terme préféré

• Notion très utilisé en indexation

• Défintion : « A term rated according to thescale of a term acceptability rating as theprimary term for a given concept »

• Il est préférable de n’avoir qu’un seul terme préféré parentrée terminologique

Page 15: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Illustration par l’exemple<struct type=“terminologicalEntry”>

<feat type=“identifier”>C675</feat>

<feat type=“definition” xml:lang=“fr”>la formation...</feat>

<struct type=“languageSection”>

<feat type=“languageIdentifier”>fr</feat>

<struct type=“termSection”>

<feat type=“term”>formation à distance</feat>

<feat type=“administrationStatus”>preferredTerm</feat>

<feat type=“identifier”>T243</feat>

</struct>

<struct type=“termSection”>

<feat type=“term”>enseignement à distance</feat>

<feat type=“identifier”>T46</feat>

</struct>

</struct>

</struct>

Page 16: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Langue Objet et langue de travail

Page 17: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Langue objet et langue de travail

• Langue objet :• identifie la langue dont on parle (information terminologique)

• Language section

• Langue de travail :• dans laquelle on parle (descriptions linguistiques)

• xml:lang

ËLe terme est le point de rencontre entre la langue objet et la langue detravail

• appartient à un bloc langue (Langue Objet)

• est décrit dans une langue donnée (Lange de Travail)

Langue objet & langue de travail

Page 18: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

TERMINOLOGICAL ENTRY

/definition/ xml:lang=“fr“Membre de l'équipage d'un vaisseau spatial

LANGUAGE SECTION franfranççaisaisTERM SECTION

/term/ astronaute

TERM SECTION/term/ cosmonaute

TERM SECTION/term/ spationaute

LANGUAGE SECTION anglaisanglaisTERM SECTION

/term/ astronaut

TERM SECTION/term/ cosmonaut

Exemple d’astronomique

Langue objet & langue de travail

LS = langue objetLangue de travail

Page 19: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

GMT

Generic Mapping Tool

Page 20: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

GMT• Représentation XML abstraite

• Identification des niveaux<struct type=“LS”>…</struct>

• Représentation des catégories de données<feat type=“definition”>…</feat>

• Pour compléter une information donnée– Le second trait raffine le premier:<brack>

<feat type=“classificationCode“>xxx</feat><feat type=“classificationSystem“>Lenoc</feat>

</brack>

GMT

Page 21: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

TERMINOLOGICAL ENTRY

/definition/ xml:lang=“fr“

Membre de l'équipage d'un vaisseau spatial

LANGUAGE SECTION

/language Identifier/=“français“TERM SECTION astronauteTERM SECTION cosmonauteTERM SECTION spationaute

LANGUAGE SECTION

/language Identifier/=“anglais“TERM SECTION astronautTERM SECTION cosmonaut

Exemple d’astronomique

GMT

Page 22: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

<struct type="terminologicalEntry">

<feat type="definition!» xml:lang=“fr“>Membre …</feat>

<struct type="languageSection">

<feat type="languageIdentifier">en</feat>

<struct type="termSection">

<feat type="term">astronaut</feat>

</struct>

<struct type="termSection">

<feat type="term">cosmonaut</feat>

</struct>

</struct>

<struct type="LanguageSection">

<feat type="languageIdentifier">fr</feat>

<struct type="termSection">

<feat type="term">astronaute</feat>

</struct>

<struct type="termSection">

<feat type="term">cosmonaute</feat>

</struct>

….

</struct>

</struct>

GMT : comment ça marche?

Page 23: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

<struct type="LanguageSection"><feat type="languageIdentifier">fr</feat><struct type="termSection">

<feat type="term">astronaute</feat></struct><struct type="termSection">

<feat type="term">cosmonaute</feat></struct><struct type="termSection">

<feat type="term">spationaute</feat></struct></struct>

</struct>

GMT : comment ça marche?

Page 24: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

L’interopérabilité

Comment ça marche en VRAI?

Page 25: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Introduction

• Principe d’interopérabilité– Si 2 TMLs possédent le même DCS, même si elles

différent radicalement dans le style et le vocabulaire,elles sont équivalentes.

ËIl est donc toujours possible d’établir un filtre pourpasser d’une TML à une autre, si elles sontintéroperables.

Ë GMT est le moyen de représentation pour le faire

GMT

Page 26: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Intéropérabilité des données

TMF

TML1 TML2 TML3 TMLi…

(TBX)(Geneter)

GMT

TMF

Page 27: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

L’interopérabilité

Illustration par l’exemple

Page 28: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

MARTIF-MSC example<termEntry id='ID67'>

<descrip type='subjectField‘>manufacturing</descrip>

<descrip type='definition'>A value between 0 and 1 used in...</descrip>

<langSet lang='en'>

<tig>

<term>alpha smoothing factor</term>

<termNote type='termType'>fullForm</termNote>

</tig>

</langSet>

<langSet lang='hu'>

<tig>

<term>Alfa ...</term>

</tig>

</langSet>

</termEntry>

Page 29: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Repérage et typage de l’information

TE

LS

TS

id=‘ID67’ [attribute]subjectField=‘!manufacturing!’ [typedElement]

definition=‘A value…’ [typedElement]

languageIdentifier =‘!hu!’ [attribute]

languageIdentifier =‘!en!’ [attribute]

term=‘…’ [element]

term=‘alpha smoothing factor’ [element]

termType=‘fullForm’ [typedElement]

tig

langSet

tig

langSet

termEntry

Page 30: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Vers TMF

TE

TS

LSLS

TS

id=‘ID67’subjectField=‘!manufacturing!’

definition=‘A value…’

languageIdentifier =‘!hu!’languageIdentifier =‘!en!’

term=‘…’term=‘alpha smoothing factor’

termType=‘fullForm’

Page 31: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

TMF<struct type=“TermEntry”>

<feat type=“id”>ID67</feat>

<feat type=“subjectField”>manufacturing</feat>

<feat type=“definition”>A value between 0 and 1 used in ...</feat>

<struct type=“LanguageSection”>

<feat type=“languageIdentifier”>en</feat>

<struct type=“TermSection”>

<feat type=“term”>alpha smoothing factor</feat>

<feat type=“termType”>fullForm</feat>

</struct>

</struct>

<struct type=“LanguageSection”>

<feat type=“languageIdentifier”>hu</feat>

<struct type=“TermSection”>

<feat type=“term”>Alfa ...</feat>

</struct>

</struct>

</struct>

Page 32: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Etablir des liens en GMT?

• La section Global Information va permettred’héberger l’information relative au lienqu’il soit

• En locale, c’est-à-dire au sein d’un même fichier

• Externe

• Utilisation de la technologie Xlink

Page 33: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Terminological Data Collection

Global information Complementary information

terminologicalEntry terminologicalEntry terminologicalEntry

languageSection languageSection languageSection languageSection

termSection termSection termSection termSection termSection

TMF et les liens

ressources

A pour terme générique

Est l’abréviation de

Page 34: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Déclaration d’une ressource

<struct type=“globalInformation”><link type=“locator”>

<feat type=“label”>fichier courant</feat><feat type=“title”>…</feat><feat type=“uri”>URI du fichier courant</feat>

</link></struct>

Page 35: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Établissement du lien<struct type="terminologicalEntry">

<struct type="languageSection">

<feat type="languageIdentifier">fr</feat>

<struct type="termSection">

<feat type="term">formation à distance</feat>

<feat type="identifier">T243</feat>

</struct>

<struct type="termSection">

<feat type="term">FAD</feat>

<feat type="identifier">T108</feat>

<link type="arc">

<feat type="locator">exemplierMSH220205.xml</feat>

<feat type="label">shortFormFor</feat>

<feat type="to">T243</feat>

</link>

</struct>

…</struct>

</struct>

Page 36: I SO Y N Easy TMF - termsciences.fr

I SOYNTAX

Slide [email protected]

Quelques liens utiles

• SALT project– http://www.ttt.org/

• The TMF site– http://www.loria.fr/projets/TMF

• The Syntax site– http://www.syntax.inist.fr