Metadata met betrekking tot Audiovisuele Media

31
medialab Metadata met betrekking tot Audiovisuele Media Metadata met betrekking tot Audiovisuele Media

description

 

Transcript of Metadata met betrekking tot Audiovisuele Media

Page 1: Metadata met betrekking tot Audiovisuele Media

medialab

Metadata met betrekking tot Audiovisuele MediaMetadata met betrekking tot Audiovisuele Media

Page 2: Metadata met betrekking tot Audiovisuele Media

2medialab

Overzicht

Definities Metadata (Meta)datamodel Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

Page 3: Metadata met betrekking tot Audiovisuele Media

3medialab

Metadata – « data over data »

Production Platform

Data General

Data General

Data General

Data General

Data General

Data General

WWWWWWWWWWWW

Communication(Information)

Metadata

Infrastructure - Networks and Storage

Production and distribution

Page 4: Metadata met betrekking tot Audiovisuele Media

4medialab

Meta – data ?

Metadata was pictografisch tot aan de uitvinding van het schrift en wordt nuterug pictografisch omwille van de tekortkomingen ervan.

Page 5: Metadata met betrekking tot Audiovisuele Media

5medialab

Definities - Metadata

Metadata is “data over data” of documentatie over (digitale) objecten in het algemeen.Het doel van metadata is om op een eenduidige manier deze objecten erover tecommuniceren.

Figuur 1 – MARC 21 record van « Planning for Automation – how-to-do it manual for librarians »

Page 6: Metadata met betrekking tot Audiovisuele Media

6medialab

Definities – Datamodel en ontologie

*

1

*

1

is associated with

*

0..1

is associated with

*

1

*

1

*

1

*

0..1 performed by*

1Referrer

*

1Includes

*

1

*

1

*

1

*

1

EDITORIAL_MASTER

INTELLECTUAL_PROPERTY NOMENCLATUREPRODUCTION

PROGRAMME_GROUP

EMA_CAST

PERFORMANCE

PGR_CAST

ROLE_TYPE

CHR_PLAY

PARTY

PAR_ASSOCIATION

ISO639

DISTRIBUTION

EMA_CONTRIBUTION

PGR_CONTRIBUTION

- PGR_ID*[1] : Unsigned lon

- EMA_ID*[1] : Unsigned lon

- PRF_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- EMA_ID[1]

- TYPE[1] : Short text

- DISTRIBUTION_CHANNEL[1] : Integer

- DISTRIBUTION_SERVICE[1]

- PLANNED_START_DATE[1]

- PLANNED_START_TIME[1]

- PLANNED_DURATION[1]

- ACTUAL_START_DATE[1]

- ACTUAL_START_TIME[1]

- ACTUAL_DURATION[1]

- QUALIFICATION_FLAG[1]

- QUALIFICATION_CODE[1]

- SUBTITLE_FLAG[1]

- SUBTITLE_TYPE[1]

- LIVE_FLAG[1]

- INTERACTIVE_FLAG[1]

- INTENDED_ASPECT_RATIO[1]

- IMAGE_FORMAT[1]

- SOUND_FORMAT[1]

- CODE*[1] : Short text (2)

- DESCRIPTION[1] : Text

- PART*[1] : Unsigned long

- COLLECTION*[1] : Unsigne

- ID*[1] : Unsigned long integer

- NAME[0..1] : Short text

- FIRSTNAME[0..1] : Short text

- SURNAME[0..1] : Short text

- DESCRIPTION[0..1] : Text

- ID*[1] : Unsigned long integer

- NAME[1] : Short text

- DESCRIPTION[0..1] : Text

- ID*[1] : Unsigned long integer

- CODE[1] : P/META 9.1.31

- NAME[1] : Short text

- DESCRIPTION[0..1] : Text - PGR_ID*[1] : Unsigned lon

- PRF_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- ROLE_TYPE[1] : Unsigned long

- CHAR_ID[0..1] : Unsigned long i

- PARTY_ID[0..1] : Unsigned long

- EMA_ID*[1] : Unsigned lon

- ID*[1] : Unsigned long integer

- COPYRIGHT_HOLDER[0..1] : Short text

- LICENSE_TYPE[0..1] : Unsigned long integer

- LICENCE_DESC[0..1] : Text

- TERRITORY[0..1] : Short text

- DISTR_CHANNEL_TYPE[0..1] : Unsigned integer

- DISTRIBUTION_CHANNEL[0..1] : Short text

- CONTRACT[0..1] : Short text

- START_DATE[0..1] : Date

- START_TIME[0..1] : Time

- END_DATE[0..1] : Date

- END_TIME[0..1] : Time

- CONDITIONAL_IND[1] : Boolean

- CONDITION_DESC[0..1] : Text

- RESTRICTION_IND[1] : Boolean

- RESTRICTION_TYPE[0..1] : Unsigned long integer

- RES_START_DATE[0..1] : Date

- RES_START_TIME[0..1] : Time

- RES_END_DATE[0..1] : Date

- RES_END_TIME[0..1] : Time

- RES_DESC[0..1] : Text

- ID*[1] : Unsigned long integer

- NATURE_ID[1] : Unsigned long integer

- NATURE[0..1] : Short text

- CATEGORY_ID[0..1] : Unsigned long integer

- CATEGORY_NAME[0..1] : Short text

- EDITORIAL_GENRE_ID[0..1] : Unsigned long integer

- EDITORIAL_GENRE_NAME[0..1] : Short text

- FORMAT_ID[0..1] : Unsigned long integer

- FORMAT_NAME[0..1] : Short text

- INTENTION_ID[0..1] : Unsigned long integer

- INTENTION_NAME[0..1] : Short text

- QLF_IND[1] : Boolean

- QLF_TYPE[0..1] : Unsigned long integer

- QLF_ADRESS[0..1] : Text

- BRAND[0..1] : Short text

- ID*[1] : Unsigned long integer

- MATERIAL_NUMBER[0..1] : Unsigned integer

- MATERIAL_DESC[0..1] : Short text

- PRODUCTION_ORDER[0..1] : Short text

- V-ISAN[0..1] : Short text

- PRD_HIERARCHY[0..1] : Short text

- PRN_SERIES[1] : Unsigned long integer

- LIVE_IND[1] : Boolean

- LIVE_LOCATION[0..1] : Short text

- PROVENANCE[0..1] : Short text

- SUPPLIER[0..1] : Short text

- PRN_DEPARTMENT[0..1] : Short text

- PRN_MANAGER[0..1] : Short text

- PRODUCER[0..1] : Short text

- DIRECTOR[0..1] : Short text

- ASSISTANT[0..1] : Short text

- CHIEF_PRODUCTION[0..1] : Short text

- PRESENTATION[0..1] : Short text

- FEATURING[0..1] : Text

- SONORISATION[0..1] : Short text

- ASSEMBLED_BY[0..1] : Short text

- ASS_WORKCENTER[0..1] : Short text

- ASS_DATE[0..1] : Date

- PROCUREMENT_TYPE[0..1] : Unsigned long integer

- MATERIAL_TYPE[0..1] : Short text

- PRODUCT_DIVISION[0..1] : Unsigned long integer

- ID*[1] : Unsigned long integer

- CMS_ID[1]

- PGR_ID[1] : Unsigned long integer

- TYPE[1] : Short text

- NUMBER[1] : Unsigned long integer

- PART_NUMBER[0..1] : Short text (3)

- VERSION[0..1] : Unsigned integer

- NAME[0..1] : Short text

- DESCRIPTION[0..1] : Text

- ANNOTATION[0..1] : Text

- INFO[0..1] : Text

- DURATION_SCRIPT[0..1] : Time

- DURATION_REVIEW[1]

- NOMENCLATURE[0..1] : Unsigned long integer

- PRODUCTION[0..1] : Unsigned long integer

- COPYRIGHT[0..1] : Unsigned long integer

- STATUS[1] : Short text

- MATERIAL_STATUS[1] : Short text

- RIGHT_STATUS[0..1] : Short text

- ID*[1] : Unsigned long integer

- PARENT_ID[1] : Unsigned long integer

- NAME[1] : Short text

- SERIES_NUMBER[0..1] : Unsigned integer

- LABEL[0..1] : Short text

- TITLE[0..1] : Short text

- ORIGINAL_TITLE[0..1] : Short text

- DESCRIPTION[0..1] : Text

- LANGUAGE_CODE[0..1] : Short text (2)

- ORI_LANGUAGE_CODE[0..1] : Short text (2)

- VOLUME[0..1] : Number

- PRODUCTION[1] : Unsigned long integer

- NOMENCLATURE[1] : Unsigned long integer

- COPYRIGHT[1] : Unsigned long integer

=> Eender welke ontologie kan perfect voorgesteld worden door een datamodel.

De ontologie (van het Grieks ὀν = zijnde, dingen en λόγος = woord, leer) is deleer van de dingen. De klassieke ontologie definieert fundamentele categorieën enonderlinge relaties. Een ontologie representeert een bepaald kennisdomein.

Wanneer we informatie in een database opslaan, gebruiken we een genormaliseerddatamodel.

• Een datamodel definieert logische entiteiten en hun relaties.• Een datamodel is genormaliseerd wanneer alle onafhankelijk variabelen zijnopgesplitst.

Page 7: Metadata met betrekking tot Audiovisuele Media

7medialab

Doelstelling van een metadata standaard

Een metadata standaard moet een zekere compatibiliteit garanderen tussen informatieverwerkendesystemen. Het definieert minstens een vocabularium, een syntax en/of een datamodel en het is eennodige(!) voorwaarde voor eenduidige communicatie tussen systemen, processen en mensen.

In het algemeen worden een standaard gedefinieerd met het oog op interoperabiliteit tussendeelsystemen.

Voorbeeld - het Telex (Teletypewriter Exchange) protocol definieert 5-bit codering (26 letters en 6speciale tekens) en 45,5 bits per seconde

Een volledige(!) garantie op compatibiliteit houdt in dat, naast een vocabularium, een syntax eneen ontologie, ook de codering en de verpakking wordt genormeerd.

Bijvoorbeeld:• Dublin Core definieert uitsluitend 15 begrippen (titel, onderwerp, format,…)• Resource Description Framework (RDF) specifieert uitsluitend de syntax van een beschrijving

Page 8: Metadata met betrekking tot Audiovisuele Media

8medialab

Metadata – « data over data »

Page 9: Metadata met betrekking tot Audiovisuele Media

9medialab

Page 10: Metadata met betrekking tot Audiovisuele Media

10medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

Page 11: Metadata met betrekking tot Audiovisuele Media

11medialab

Enterprise Resources Planning - Logistieke metadata (APICS)

Supply

(Production)

Material Master

New Products

(Creativity)

Bill of Material

Sales

(Distribution)

Product Catalog

Sales and Operations Planning• Logistieke metadata is informatie met betrekkingtot de ontwikkeling, productie en distributie van hetproduct.

• Logistieke informatie vormt de basis van een ERPsysteem en wordt meestel gecommuniceerd als inhoudvan een document.

• APICS (www.apics.org) is een industrieassociatiedie het logistiek vocabularium standaardiseert.

Page 12: Metadata met betrekking tot Audiovisuele Media

12medialab

Product Engineering - Beschrijvende metadata (CAD/CAM)

• Beschrijvende metadata is informatie met betrekking tot de inhoudvan het product en ze is meestal het resultaat van eenproductontwikkelingsproces. Indien mogelijk wordt dit procesgeformaliseerd en gebruikt men hiervoor een CAD systeem.

• In het algemeen is beschrijvende informatie beschikbaar onder devorm van tekst of grafische modellen.

• Per industrie en per type product zijn er vaak verschillendemethodes met bijhorende documentatiestandaarden:

• Nieuws maakt gebruik van NewsML (www.iptc.org/newsml)• Movie Script Markup Language (MSML) is in ontwikkeling

Page 13: Metadata met betrekking tot Audiovisuele Media

13medialab

Het archief – Annoteren, indexeren, opzoeken…

ArchiveSystem

• Het archiefsysteem verzamelt alle beschikbare metadata met betrekking tot ruwmateriaal of afgewerkte producten. P/META (www.ebu.ch) is origineel ontwikkeldvoor deze specifieke toepassing.

• De documentalist rubriceert en categoriseert de beschikbare items. Hij gebruikthiervoor meestal termen uit een gecontroleerde lijst en hij kan de de facto standaardLibrary of Congress Subject Headings (http://authorities.loc.gov) gebruiken.

• Wanneer feature extraction algoritmes worden gebruikt om diverse visuele, auraleof conceptuele entiteiten te herkennen, maken we bij voorkeur gebruik van ISO/IECMpeg7 (http://en.wikipedia.org/wiki/mpeg7).

P/META

Feature ExtractionSystem

Mpeg7

Page 14: Metadata met betrekking tot Audiovisuele Media

14medialab

Page 15: Metadata met betrekking tot Audiovisuele Media

15medialab

Sales and Distribution – Electronische Programmagids (TVAnytime)

P/META

• De elektronische programmagids (EPG) is een onderdeel van het proces ‘Salesand Distribution’ en het is een combinatie van logistieke en inhoudelijke gegevensafkomstig uit het ERP systeem en het productontwikkelingsproces.

• De EPG informatie wordt meestal gecentraliseerd in een distribution schedulingsysteem, en dit publiceert op haar beurt het zendschema naar diverse platformen. Wekunnen bijvoorbeeld P/META (www.ebu.ch) recupereren om deze interface teimplementeren.

• Hoewel TV-Anytime (www.tv-anytime.org, genormeerd door ETSI) beschikbaar isom uitzendschema’s te representeren, worden in de praktijk nog steeds voor elkdoelplatform proprietaire interfaces ontwikkeld.

DistributionScheduling

System

TV-Anytime

Page 16: Metadata met betrekking tot Audiovisuele Media

16medialab

Voorbeeld - Newswires

1922 – Eerste commerciele telex machines 1979: IPTC 7901 (Tekstberichten) « Designed for computerised handling » 1990: IIM (Binary file format - IPTC headers in pictures) 1997: NITF (Uitsluitend tekst, ontwikkeld in SGML en nadien geporteerd naar XML)

1998 - XML 1.0 recommendation by W3C 1998: NewsML, ontwikkeld door Reuters, XML representatie van text, foto’s en video 2000: NewsML 1.0 accepted by IPTC 2008: NewsML-G2 joint effort of IPTC and EBU, includes support for timecodes and taxonomies

NewsItem

Descriptive• Language• Genre• Context• Mention • Relates to• Of interest to

Administrative• Publisher• Creator• Source • Contributor• History

Rights• Ownership• Usage terms

Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)

• Streaming Technical metadataTechnical metadata

Type• Mediatype

NewsLines• HeadLine• SlugLine• ByLine• Keywords

Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)

• Size Duration Width• Height Resolution Color• Streaming Technical metadataTechnical metadata

Page 17: Metadata met betrekking tot Audiovisuele Media

17medialab

Evolutie van de Informatietechnologie

EDP EDP –– Electronic Data Processing Electronic Data Processing• Digital Information•• Client/Server-based architectures• Databases and Data-pumps• Remote Procedure Calls use plain text

Info•Xyzlk•Ouidf•oidf

Conventional MethodsConventional Methods• Analog Media and File Cabinets• “Wires”• Thesaurus

Integrated ProcessesIntegrated Processes• Digital Media - “Metadata”• File-based production – Information Overflow• Service-Oriented Architectures• Webservices use hypertext (XML)• Point-to-point Interfaces

IntegrationIntegrationSemantic ComputingSemantic Computing• “Semantic web” • Information-centric infrastructures• Knowledge Management• Semantic reasoning

19701970 19901990 20102010Pre-Digitization

Analogue SystemsGeneration 1

Stand-Alone SystemsGeneration 2The Internet

Generation XAmbient Intelligence

Single SourceData

Page 18: Metadata met betrekking tot Audiovisuele Media

18medialab

Page 19: Metadata met betrekking tot Audiovisuele Media

19medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

Page 20: Metadata met betrekking tot Audiovisuele Media

20medialab

Typevoorbeeld

Archive Database SystemMedia Asset Management System

archiefnummer : ALG 20010813 1fragmentnummer : 1

reeks : 1000 ZONNEN EN GARNALEN

bandnummer : E03024404formaat : DBCM

fragmenttitel : 1000 ZONNEN & GARNALEN

beeld : KL/PALPLUSfragmentduur : 18 20

tekst : 0'00" TOERISTISCH REPORTAGEMAGAZINE OVERZICHT

ONDERWERPEN GENERIEK TOERISTISCH REPORTAGEMAGAZINE, OVERZICHT ONDERWERPEN

0'50" VANDAAG : KUNSTENAAR LUC HOFKENS ONTWIERP EEN OASE

OP ZIJN DAKTERRAS IN BORGERHOUT DIE DOET DENKEN AAN DE

GRAND CANYON INTERVIEW MET LUC EN ZIJN VROUW MARILOU BUITENBEELD DAK MET OMGEVING BUITENKANT

ARBEIDERSWONING, PANO OVER ROTSWANDEN, KRATEN MET WATER,

BEPANTING, FOTOALBUM MET VERLOOP WERKENtrefwoorden : BELGIE; BORGERHOUT; ARTIEST; OASE; KUNST; GRAND

CANYON (NATUURGEBIED); DAK; TERRAS; INTERVIEW; EURO

SPACE CENTER; RUIMTEVAART; PC; BOOTTOCHT; RIJKDOM; PASSAGIER; GASTRONOMIE; RESTAURANT; PERSONEEL

rechthebbende : VRT

Page 21: Metadata met betrekking tot Audiovisuele Media

21medialab

Typevoorbeeld

Page 22: Metadata met betrekking tot Audiovisuele Media

22medialab

Consensus en functionaliteit

Systeemintegratie is vaak een compromis. We moeten het evenwicht zoeken tussen eenalgemene aanvaarde oplossing (door toepassing van een standaard) en een specifiekepuntoplossing waarvan men de zekerheid heeft dat ze goed werkt.

• Interfaces op basis van een metadatastandaard is gemakkelijk herbruikbaar en het geheelblijft relatief makkelijk beheersbaar. Ze veroorzaken meestal relatief veel overhead.

• Specifieke oplossingen kunnen gemakkelijker geoptimaliseerd worden in functie vanefficiëntie en performantie.

=> Strategie – Standaard waar mogelijk, puntoplossing waar nodig

Page 23: Metadata met betrekking tot Audiovisuele Media

23medialab

Overzicht van beschikbare standaarden

Stand-AloneStand-AloneSystemsSystems

HardwiredHardwired

Long-Term StrategyLong-Term StrategyPartial SolutionsPartial Solutions

Specific SolutionsSpecific Solutions

Functionaliteit

Con

sens

usHighHigh

LowLow

LowLow HighHigh

SemanticReasoning

CustomDevelopment

GenericGenericStandardsStandards

AmbientAmbientIntelligenceIntelligence

De FactoDe FactoStandardsStandards

Page 24: Metadata met betrekking tot Audiovisuele Media

24medialab

Overzicht

Definities Verschillende aspecten van metadata Ontologie Metadatastandaard

Types en verschijningsvormen van metadata

Probleemstelling en oplossingsstrategie

Uitdagingen

Conclusies

Page 25: Metadata met betrekking tot Audiovisuele Media

25medialab

Gartner

Page 26: Metadata met betrekking tot Audiovisuele Media

26medialab

CAD/CAM for Drama Production

?

Page 27: Metadata met betrekking tot Audiovisuele Media

27medialab

The Semantic Gap

Allegory of Fortune, Dosso Dossi

Prosperity in life is transitory anddependant on luck

Semantic awareness is more then database management. Itis unique to rich media and it requires interpretation,

translation, historic background, etc.

Page 28: Metadata met betrekking tot Audiovisuele Media

28medialab

Conclusies

Een volledige oplossing voor het probleem van systeemintegratiespecifieert minstens een encodering, een vocabularium, een syntax,een datamodel en een verpakking.

De formele standaarden die tot nu zijn ontwikkeld binnen deaudiovisuele industrie zijn meestal te algemeen of te moeilijk.

In de praktijk behelpt men zich vandaag bijna altijd metpuntoplossingen of industriestandaarden.

Omdat de natuurlijke taal tekort schiet als accurate beschrijving, gaanwe terug naar meerdimensionale grafische modellen.

De grootste uitdaging voor het semantisch web is de semantischeinterpretatie van grafische objecten

Page 29: Metadata met betrekking tot Audiovisuele Media

29medialab

Page 30: Metadata met betrekking tot Audiovisuele Media

30medialab

ISAN Registration Authorities

Agence Française ISAN Aribsan (Spain and Latin America) ISAN Australasia (Australia and New Zealand) ISAN Berne (Switserland and neighbouring countries) ISAN NL (Netherlands) ISAN RA Deuthschland Microsoft Studios (USA) Secure Path (USA) ISAN IFTA (IFTA members) ISAN UK ISAN Sverige ISAN PL (Poland) Abrisan (Brazil) ISAN Iran

Page 31: Metadata met betrekking tot Audiovisuele Media

31medialab

http://medialab.vrt.be [email protected]