Metadata met betrekking tot Audiovisuele Media

Post on 05-Dec-2014

2.019 views 1 download

description

 

Transcript of Metadata met betrekking tot Audiovisuele Media

medialab

Metadata met betrekking tot Audiovisuele MediaMetadata met betrekking tot Audiovisuele Media

2medialab

Overzicht

Definities Metadata (Meta)datamodel Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

3medialab

Metadata – « data over data »

Production Platform

Data General

Data General

Data General

Data General

Data General

Data General

WWWWWWWWWWWW

Communication(Information)

Metadata

Infrastructure - Networks and Storage

Production and distribution

4medialab

Meta – data ?

Metadata was pictografisch tot aan de uitvinding van het schrift en wordt nuterug pictografisch omwille van de tekortkomingen ervan.

5medialab

Definities - Metadata

Metadata is “data over data” of documentatie over (digitale) objecten in het algemeen.Het doel van metadata is om op een eenduidige manier deze objecten erover tecommuniceren.

Figuur 1 – MARC 21 record van « Planning for Automation – how-to-do it manual for librarians »

6medialab

Definities – Datamodel en ontologie

*

1

*

1

is associated with

*

0..1

is associated with

*

1

*

1

*

1

*

0..1 performed by*

1Referrer

*

1Includes

*

1

*

1

*

1

*

1

EDITORIAL_MASTER

INTELLECTUAL_PROPERTY NOMENCLATUREPRODUCTION

PROGRAMME_GROUP

EMA_CAST

PERFORMANCE

PGR_CAST

ROLE_TYPE

CHR_PLAY

PARTY

PAR_ASSOCIATION

ISO639

DISTRIBUTION

EMA_CONTRIBUTION

PGR_CONTRIBUTION

- PGR_ID*[1] : Unsigned lon

- EMA_ID*[1] : Unsigned lon

- PRF_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- EMA_ID[1]

- TYPE[1] : Short text

- DISTRIBUTION_CHANNEL[1] : Integer

- DISTRIBUTION_SERVICE[1]

- PLANNED_START_DATE[1]

- PLANNED_START_TIME[1]

- PLANNED_DURATION[1]

- ACTUAL_START_DATE[1]

- ACTUAL_START_TIME[1]

- ACTUAL_DURATION[1]

- QUALIFICATION_FLAG[1]

- QUALIFICATION_CODE[1]

- SUBTITLE_FLAG[1]

- SUBTITLE_TYPE[1]

- LIVE_FLAG[1]

- INTERACTIVE_FLAG[1]

- INTENDED_ASPECT_RATIO[1]

- IMAGE_FORMAT[1]

- SOUND_FORMAT[1]

- CODE*[1] : Short text (2)

- DESCRIPTION[1] : Text

- PART*[1] : Unsigned long

- COLLECTION*[1] : Unsigne

- ID*[1] : Unsigned long integer

- NAME[0..1] : Short text

- FIRSTNAME[0..1] : Short text

- SURNAME[0..1] : Short text

- DESCRIPTION[0..1] : Text

- ID*[1] : Unsigned long integer

- NAME[1] : Short text

- DESCRIPTION[0..1] : Text

- ID*[1] : Unsigned long integer

- CODE[1] : P/META 9.1.31

- NAME[1] : Short text

- DESCRIPTION[0..1] : Text - PGR_ID*[1] : Unsigned lon

- PRF_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- ROLE_TYPE[1] : Unsigned long

- CHAR_ID[0..1] : Unsigned long i

- PARTY_ID[0..1] : Unsigned long

- EMA_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- COPYRIGHT_HOLDER[0..1] : Short text

- LICENSE_TYPE[0..1] : Unsigned long integer

- LICENCE_DESC[0..1] : Text

- TERRITORY[0..1] : Short text

- DISTR_CHANNEL_TYPE[0..1] : Unsigned integer

- DISTRIBUTION_CHANNEL[0..1] : Short text

- CONTRACT[0..1] : Short text

- START_DATE[0..1] : Date

- START_TIME[0..1] : Time

- END_DATE[0..1] : Date

- END_TIME[0..1] : Time

- CONDITIONAL_IND[1] : Boolean

- CONDITION_DESC[0..1] : Text

- RESTRICTION_IND[1] : Boolean

- RESTRICTION_TYPE[0..1] : Unsigned long integer

- RES_START_DATE[0..1] : Date

- RES_START_TIME[0..1] : Time

- RES_END_DATE[0..1] : Date

- RES_END_TIME[0..1] : Time

- RES_DESC[0..1] : Text

- ID*[1] : Unsigned long integer

- NATURE_ID[1] : Unsigned long integer

- NATURE[0..1] : Short text

- CATEGORY_ID[0..1] : Unsigned long integer

- CATEGORY_NAME[0..1] : Short text

- EDITORIAL_GENRE_ID[0..1] : Unsigned long integer

- EDITORIAL_GENRE_NAME[0..1] : Short text

- FORMAT_ID[0..1] : Unsigned long integer

- FORMAT_NAME[0..1] : Short text

- INTENTION_ID[0..1] : Unsigned long integer

- INTENTION_NAME[0..1] : Short text

- QLF_IND[1] : Boolean

- QLF_TYPE[0..1] : Unsigned long integer

- QLF_ADRESS[0..1] : Text

- BRAND[0..1] : Short text

- ID*[1] : Unsigned long integer

- MATERIAL_NUMBER[0..1] : Unsigned integer

- MATERIAL_DESC[0..1] : Short text

- PRODUCTION_ORDER[0..1] : Short text

- V-ISAN[0..1] : Short text

- PRD_HIERARCHY[0..1] : Short text

- PRN_SERIES[1] : Unsigned long integer

- LIVE_IND[1] : Boolean

- LIVE_LOCATION[0..1] : Short text

- PROVENANCE[0..1] : Short text

- SUPPLIER[0..1] : Short text

- PRN_DEPARTMENT[0..1] : Short text

- PRN_MANAGER[0..1] : Short text

- PRODUCER[0..1] : Short text

- DIRECTOR[0..1] : Short text

- ASSISTANT[0..1] : Short text

- CHIEF_PRODUCTION[0..1] : Short text

- PRESENTATION[0..1] : Short text

- FEATURING[0..1] : Text

- SONORISATION[0..1] : Short text

- ASSEMBLED_BY[0..1] : Short text

- ASS_WORKCENTER[0..1] : Short text

- ASS_DATE[0..1] : Date

- PROCUREMENT_TYPE[0..1] : Unsigned long integer

- MATERIAL_TYPE[0..1] : Short text

- PRODUCT_DIVISION[0..1] : Unsigned long integer

- ID*[1] : Unsigned long integer

- CMS_ID[1]

- PGR_ID[1] : Unsigned long integer

- TYPE[1] : Short text

- NUMBER[1] : Unsigned long integer

- PART_NUMBER[0..1] : Short text (3)

- VERSION[0..1] : Unsigned integer

- NAME[0..1] : Short text

- DESCRIPTION[0..1] : Text

- ANNOTATION[0..1] : Text

- INFO[0..1] : Text

- DURATION_SCRIPT[0..1] : Time

- DURATION_REVIEW[1]

- NOMENCLATURE[0..1] : Unsigned long integer

- PRODUCTION[0..1] : Unsigned long integer

- COPYRIGHT[0..1] : Unsigned long integer

- STATUS[1] : Short text

- MATERIAL_STATUS[1] : Short text

- RIGHT_STATUS[0..1] : Short text

- ID*[1] : Unsigned long integer

- PARENT_ID[1] : Unsigned long integer

- NAME[1] : Short text

- SERIES_NUMBER[0..1] : Unsigned integer

- LABEL[0..1] : Short text

- TITLE[0..1] : Short text

- ORIGINAL_TITLE[0..1] : Short text

- DESCRIPTION[0..1] : Text

- LANGUAGE_CODE[0..1] : Short text (2)

- ORI_LANGUAGE_CODE[0..1] : Short text (2)

- VOLUME[0..1] : Number

- PRODUCTION[1] : Unsigned long integer

- NOMENCLATURE[1] : Unsigned long integer

- COPYRIGHT[1] : Unsigned long integer

=> Eender welke ontologie kan perfect voorgesteld worden door een datamodel.

De ontologie (van het Grieks ὀν = zijnde, dingen en λόγος = woord, leer) is deleer van de dingen. De klassieke ontologie definieert fundamentele categorieën enonderlinge relaties. Een ontologie representeert een bepaald kennisdomein.

Wanneer we informatie in een database opslaan, gebruiken we een genormaliseerddatamodel.

• Een datamodel definieert logische entiteiten en hun relaties.• Een datamodel is genormaliseerd wanneer alle onafhankelijk variabelen zijnopgesplitst.

7medialab

Doelstelling van een metadata standaard

Een metadata standaard moet een zekere compatibiliteit garanderen tussen informatieverwerkendesystemen. Het definieert minstens een vocabularium, een syntax en/of een datamodel en het is eennodige(!) voorwaarde voor eenduidige communicatie tussen systemen, processen en mensen.

In het algemeen worden een standaard gedefinieerd met het oog op interoperabiliteit tussendeelsystemen.

Voorbeeld - het Telex (Teletypewriter Exchange) protocol definieert 5-bit codering (26 letters en 6speciale tekens) en 45,5 bits per seconde

Een volledige(!) garantie op compatibiliteit houdt in dat, naast een vocabularium, een syntax eneen ontologie, ook de codering en de verpakking wordt genormeerd.

Bijvoorbeeld:• Dublin Core definieert uitsluitend 15 begrippen (titel, onderwerp, format,…)• Resource Description Framework (RDF) specifieert uitsluitend de syntax van een beschrijving

8medialab

Metadata – « data over data »

9medialab

10medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

11medialab

Enterprise Resources Planning - Logistieke metadata (APICS)

Supply

(Production)

Material Master

New Products

(Creativity)

Bill of Material

Sales

(Distribution)

Product Catalog

Sales and Operations Planning• Logistieke metadata is informatie met betrekkingtot de ontwikkeling, productie en distributie van hetproduct.

• Logistieke informatie vormt de basis van een ERPsysteem en wordt meestel gecommuniceerd als inhoudvan een document.

• APICS (www.apics.org) is een industrieassociatiedie het logistiek vocabularium standaardiseert.

12medialab

Product Engineering - Beschrijvende metadata (CAD/CAM)

• Beschrijvende metadata is informatie met betrekking tot de inhoudvan het product en ze is meestal het resultaat van eenproductontwikkelingsproces. Indien mogelijk wordt dit procesgeformaliseerd en gebruikt men hiervoor een CAD systeem.

• In het algemeen is beschrijvende informatie beschikbaar onder devorm van tekst of grafische modellen.

• Per industrie en per type product zijn er vaak verschillendemethodes met bijhorende documentatiestandaarden:

• Nieuws maakt gebruik van NewsML (www.iptc.org/newsml)• Movie Script Markup Language (MSML) is in ontwikkeling

13medialab

Het archief – Annoteren, indexeren, opzoeken…

ArchiveSystem

• Het archiefsysteem verzamelt alle beschikbare metadata met betrekking tot ruwmateriaal of afgewerkte producten. P/META (www.ebu.ch) is origineel ontwikkeldvoor deze specifieke toepassing.

• De documentalist rubriceert en categoriseert de beschikbare items. Hij gebruikthiervoor meestal termen uit een gecontroleerde lijst en hij kan de de facto standaardLibrary of Congress Subject Headings (http://authorities.loc.gov) gebruiken.

• Wanneer feature extraction algoritmes worden gebruikt om diverse visuele, auraleof conceptuele entiteiten te herkennen, maken we bij voorkeur gebruik van ISO/IECMpeg7 (http://en.wikipedia.org/wiki/mpeg7).

P/META

Feature ExtractionSystem

Mpeg7

14medialab

15medialab

Sales and Distribution – Electronische Programmagids (TVAnytime)

P/META

• De elektronische programmagids (EPG) is een onderdeel van het proces ‘Salesand Distribution’ en het is een combinatie van logistieke en inhoudelijke gegevensafkomstig uit het ERP systeem en het productontwikkelingsproces.

• De EPG informatie wordt meestal gecentraliseerd in een distribution schedulingsysteem, en dit publiceert op haar beurt het zendschema naar diverse platformen. Wekunnen bijvoorbeeld P/META (www.ebu.ch) recupereren om deze interface teimplementeren.

• Hoewel TV-Anytime (www.tv-anytime.org, genormeerd door ETSI) beschikbaar isom uitzendschema’s te representeren, worden in de praktijk nog steeds voor elkdoelplatform proprietaire interfaces ontwikkeld.

DistributionScheduling

System

TV-Anytime

16medialab

Voorbeeld - Newswires

1922 – Eerste commerciele telex machines 1979: IPTC 7901 (Tekstberichten) « Designed for computerised handling » 1990: IIM (Binary file format - IPTC headers in pictures) 1997: NITF (Uitsluitend tekst, ontwikkeld in SGML en nadien geporteerd naar XML)

1998 - XML 1.0 recommendation by W3C 1998: NewsML, ontwikkeld door Reuters, XML representatie van text, foto’s en video 2000: NewsML 1.0 accepted by IPTC 2008: NewsML-G2 joint effort of IPTC and EBU, includes support for timecodes and taxonomies

NewsItem

Descriptive• Language• Genre• Context• Mention • Relates to• Of interest to

Administrative• Publisher• Creator• Source • Contributor• History

Rights• Ownership• Usage terms

Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)

• Streaming Technical metadataTechnical metadata

Type• Mediatype

NewsLines• HeadLine• SlugLine• ByLine• Keywords

Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)

• Size Duration Width• Height Resolution Color• Streaming Technical metadataTechnical metadata

17medialab

Evolutie van de Informatietechnologie

EDP EDP –– Electronic Data Processing Electronic Data Processing• Digital Information•• Client/Server-based architectures• Databases and Data-pumps• Remote Procedure Calls use plain text

Info•Xyzlk•Ouidf•oidf

Conventional MethodsConventional Methods• Analog Media and File Cabinets• “Wires”• Thesaurus

Integrated ProcessesIntegrated Processes• Digital Media - “Metadata”• File-based production – Information Overflow• Service-Oriented Architectures• Webservices use hypertext (XML)• Point-to-point Interfaces

IntegrationIntegrationSemantic ComputingSemantic Computing• “Semantic web” • Information-centric infrastructures• Knowledge Management• Semantic reasoning

19701970 19901990 20102010Pre-Digitization

Analogue SystemsGeneration 1

Stand-Alone SystemsGeneration 2The Internet

Generation XAmbient Intelligence

Single SourceData

18medialab

19medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

20medialab

Typevoorbeeld

Archive Database SystemMedia Asset Management System

archiefnummer : ALG 20010813 1fragmentnummer : 1

reeks : 1000 ZONNEN EN GARNALEN

bandnummer : E03024404formaat : DBCM

fragmenttitel : 1000 ZONNEN & GARNALEN

beeld : KL/PALPLUSfragmentduur : 18 20

tekst : 0'00" TOERISTISCH REPORTAGEMAGAZINE OVERZICHT

ONDERWERPEN GENERIEK TOERISTISCH REPORTAGEMAGAZINE, OVERZICHT ONDERWERPEN

0'50" VANDAAG : KUNSTENAAR LUC HOFKENS ONTWIERP EEN OASE

OP ZIJN DAKTERRAS IN BORGERHOUT DIE DOET DENKEN AAN DE

GRAND CANYON INTERVIEW MET LUC EN ZIJN VROUW MARILOU BUITENBEELD DAK MET OMGEVING BUITENKANT

ARBEIDERSWONING, PANO OVER ROTSWANDEN, KRATEN MET WATER,

BEPANTING, FOTOALBUM MET VERLOOP WERKENtrefwoorden : BELGIE; BORGERHOUT; ARTIEST; OASE; KUNST; GRAND

CANYON (NATUURGEBIED); DAK; TERRAS; INTERVIEW; EURO

SPACE CENTER; RUIMTEVAART; PC; BOOTTOCHT; RIJKDOM; PASSAGIER; GASTRONOMIE; RESTAURANT; PERSONEEL

rechthebbende : VRT

21medialab

Typevoorbeeld

22medialab

Consensus en functionaliteit

Systeemintegratie is vaak een compromis. We moeten het evenwicht zoeken tussen eenalgemene aanvaarde oplossing (door toepassing van een standaard) en een specifiekepuntoplossing waarvan men de zekerheid heeft dat ze goed werkt.

• Interfaces op basis van een metadatastandaard is gemakkelijk herbruikbaar en het geheelblijft relatief makkelijk beheersbaar. Ze veroorzaken meestal relatief veel overhead.

• Specifieke oplossingen kunnen gemakkelijker geoptimaliseerd worden in functie vanefficiëntie en performantie.

=> Strategie – Standaard waar mogelijk, puntoplossing waar nodig

23medialab

Overzicht van beschikbare standaarden

Stand-AloneStand-AloneSystemsSystems

HardwiredHardwired

Long-Term StrategyLong-Term StrategyPartial SolutionsPartial Solutions

Specific SolutionsSpecific Solutions

Functionaliteit

Con

sens

usHighHigh

LowLow

LowLow HighHigh

SemanticReasoning

CustomDevelopment

GenericGenericStandardsStandards

AmbientAmbientIntelligenceIntelligence

De FactoDe FactoStandardsStandards

24medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

25medialab

Gartner

26medialab

CAD/CAM for Drama Production

?

27medialab

The Semantic Gap

Allegory of Fortune, Dosso Dossi

Prosperity in life is transitory anddependant on luck

Semantic awareness is more then database management. Itis unique to rich media and it requires interpretation,

translation, historic background, etc.

28medialab

Conclusies

Een volledige oplossing voor het probleem van systeemintegratiespecifieert minstens een encodering, een vocabularium, een syntax,een datamodel en een verpakking.

De formele standaarden die tot nu zijn ontwikkeld binnen deaudiovisuele industrie zijn meestal te algemeen of te moeilijk.

In de praktijk behelpt men zich vandaag bijna altijd metpuntoplossingen of industriestandaarden.

Omdat de natuurlijke taal tekort schiet als accurate beschrijving, gaanwe terug naar meerdimensionale grafische modellen.

De grootste uitdaging voor het semantisch web is de semantischeinterpretatie van grafische objecten

29medialab

30medialab

ISAN Registration Authorities

Agence Française ISAN Aribsan (Spain and Latin America) ISAN Australasia (Australia and New Zealand) ISAN Berne (Switserland and neighbouring countries) ISAN NL (Netherlands) ISAN RA Deuthschland Microsoft Studios (USA) Secure Path (USA) ISAN IFTA (IFTA members) ISAN UK ISAN Sverige ISAN PL (Poland) Abrisan (Brazil) ISAN Iran

31medialab

http://medialab.vrt.be Maarten.verwaest@vrt.be