Het machine verstaanbaar boek - de volle kracht van metadata

17
Het machine-verstaanbaar boek: de volle kracht van metadata Tom De Nies, Miel Vander Sande, Wesley De Neve, Erik Mannens Universiteit Gent – iMinds – Multimedia Lab ELIS - Multimedia Lab

description

Het machine verstaanbaar boek - de volle kracht van metadata.

Transcript of Het machine verstaanbaar boek - de volle kracht van metadata

Page 1: Het machine verstaanbaar boek - de volle kracht van metadata

Het machine-verstaanbaar boek: de volle kracht van metadata

Tom De Nies, Miel Vander Sande, Wesley De Neve, Erik Mannens

Universiteit Gent – iMinds – Multimedia Lab

ELIS - Multimedia Lab

Page 2: Het machine verstaanbaar boek - de volle kracht van metadata

Machine-verstaanbare data

ELIS - Multimedia Lab

=

data die niet alleen kunnen gelezen worden door machines,

maar data die ook kunnen begrepen worden door machines bv. “Washington is mooi in de lente.” Washington: locatie of persoon?

2/17

Page 3: Het machine verstaanbaar boek - de volle kracht van metadata

Mens versus machine

ELIS - Multimedia Lab

Waarom willen we machine-verstaanbare data?

3/17

Page 4: Het machine verstaanbaar boek - de volle kracht van metadata

Hierom

ELIS - Multimedia Lab

We willen machines gebruiken om automatisch ★ grote hoeveelheden data te verzamelen ★ verbanden te leggen (redeneren) ★ complexe vragen te beantwoorden ★… Automatisch? ★ snel ★ schaalbaar

4/17

Page 5: Het machine verstaanbaar boek - de volle kracht van metadata

Wat betekent dit voor boeken?

ELIS - Multimedia Lab

5/17

Page 6: Het machine verstaanbaar boek - de volle kracht van metadata

Dracula Dissected

ELIS - Multimedia Lab

Manuele annotatie van “Dracula” met informatie over karakters, locaties, reiswegen, etc. Laat toe het verhaal vanuit verschillende standpunten te beleven Kan dit automatisch en generiek?

6/17

Page 7: Het machine verstaanbaar boek - de volle kracht van metadata

ELIS - Multimedia Lab

Nieuws manueel gelinkt met boeken

nieuws

topic

boeken

Kan dit automatisch en generiek?

Books for Understanding

7/17

Page 8: Het machine verstaanbaar boek - de volle kracht van metadata

Ja, door gebruik te maken van....

ELIS - Multimedia Lab

★ Machine-verstaanbare data ○ eenduidige structuur ○ eenduidige betekenis (“semantiek”)

<span about=”http://dbpedia.org/resource/George_Washington” typeof=”http://dbpedia.org/ontology/Person”>

Washington</span>

8/17

Page 9: Het machine verstaanbaar boek - de volle kracht van metadata

Hoe pakken we dit aan?

ELIS - Multimedia Lab

“A Publisher’s Job Is to Provide a Good API for Books”

- Hugh McGuire, drijvende kracht achter Pressbooks.com & co-editor van “Book: A Futurist’s Manifesto”

9/17

Page 10: Het machine verstaanbaar boek - de volle kracht van metadata

API (1/3)

ELIS - Multimedia Lab

Wat is een API?

“Application Programming Interface”

~

Een manier om machines toegang te geven tot data

10/17

Page 11: Het machine verstaanbaar boek - de volle kracht van metadata

API (2/3)

ELIS - Multimedia Lab

Traditioneel: analoog boek = data in papieren vorm

Ontsluiten van data: via “fysieke API”

11/17

Page 12: Het machine verstaanbaar boek - de volle kracht van metadata

API (3/3)

ELIS - Multimedia Lab

Nu: digitaal boek = data in elektronische vorm

Ontsluiten van data: via machine-verstaanbare annotaties

12/17

Page 13: Het machine verstaanbaar boek - de volle kracht van metadata

Machine-verstaanbare annotaties

ELIS - Multimedia Lab

Manueel

+ nauwkeurig

- zeer arbeidsintensief en niet schaalbaar

Automatisch

- soms onnauwkeurig

+ snel en schaalbaar

13/17

Page 14: Het machine verstaanbaar boek - de volle kracht van metadata

Machine-verstaanbaar boek: aanmaak

ELIS - Multimedia Lab

Annotatie

Uitpakken

Her- verpakken

14/17

Page 15: Het machine verstaanbaar boek - de volle kracht van metadata

Machine-verstaanbaar boek: gebruik

ELIS - Multimedia Lab

Data! ★ Personen ★ Locaties ★ Organisaties ★ Activiteiten ★ ...

RDFa “Distiller”

15/17

Page 16: Het machine verstaanbaar boek - de volle kracht van metadata

Ons doel

ELIS - Multimedia Lab

van

“Dracula Dissected” - manuele annotatie

- manuele selectie & compositie

naar

“Dracula Distilled” - automatische annotatie

- automatische selectie & compositie

16/17