Het machine verstaanbaar boek - de volle kracht van metadata
-
Upload
wesley-de-neve -
Category
Technology
-
view
261 -
download
0
description
Transcript of Het machine verstaanbaar boek - de volle kracht van metadata
Het machine-verstaanbaar boek: de volle kracht van metadata
Tom De Nies, Miel Vander Sande, Wesley De Neve, Erik Mannens
Universiteit Gent – iMinds – Multimedia Lab
ELIS - Multimedia Lab
Machine-verstaanbare data
ELIS - Multimedia Lab
=
data die niet alleen kunnen gelezen worden door machines,
maar data die ook kunnen begrepen worden door machines bv. “Washington is mooi in de lente.” Washington: locatie of persoon?
2/17
Mens versus machine
ELIS - Multimedia Lab
Waarom willen we machine-verstaanbare data?
3/17
Hierom
ELIS - Multimedia Lab
We willen machines gebruiken om automatisch ★ grote hoeveelheden data te verzamelen ★ verbanden te leggen (redeneren) ★ complexe vragen te beantwoorden ★… Automatisch? ★ snel ★ schaalbaar
4/17
Wat betekent dit voor boeken?
ELIS - Multimedia Lab
5/17
Dracula Dissected
ELIS - Multimedia Lab
Manuele annotatie van “Dracula” met informatie over karakters, locaties, reiswegen, etc. Laat toe het verhaal vanuit verschillende standpunten te beleven Kan dit automatisch en generiek?
6/17
ELIS - Multimedia Lab
Nieuws manueel gelinkt met boeken
nieuws
topic
boeken
Kan dit automatisch en generiek?
Books for Understanding
7/17
Ja, door gebruik te maken van....
ELIS - Multimedia Lab
★ Machine-verstaanbare data ○ eenduidige structuur ○ eenduidige betekenis (“semantiek”)
<span about=”http://dbpedia.org/resource/George_Washington” typeof=”http://dbpedia.org/ontology/Person”>
Washington</span>
8/17
Hoe pakken we dit aan?
ELIS - Multimedia Lab
“A Publisher’s Job Is to Provide a Good API for Books”
- Hugh McGuire, drijvende kracht achter Pressbooks.com & co-editor van “Book: A Futurist’s Manifesto”
9/17
API (1/3)
ELIS - Multimedia Lab
Wat is een API?
“Application Programming Interface”
~
Een manier om machines toegang te geven tot data
10/17
API (2/3)
ELIS - Multimedia Lab
Traditioneel: analoog boek = data in papieren vorm
Ontsluiten van data: via “fysieke API”
11/17
API (3/3)
ELIS - Multimedia Lab
Nu: digitaal boek = data in elektronische vorm
Ontsluiten van data: via machine-verstaanbare annotaties
12/17
Machine-verstaanbare annotaties
ELIS - Multimedia Lab
Manueel
+ nauwkeurig
- zeer arbeidsintensief en niet schaalbaar
Automatisch
- soms onnauwkeurig
+ snel en schaalbaar
13/17
Machine-verstaanbaar boek: aanmaak
ELIS - Multimedia Lab
Annotatie
Uitpakken
Her- verpakken
14/17
Machine-verstaanbaar boek: gebruik
ELIS - Multimedia Lab
Data! ★ Personen ★ Locaties ★ Organisaties ★ Activiteiten ★ ...
RDFa “Distiller”
15/17
Ons doel
ELIS - Multimedia Lab
van
“Dracula Dissected” - manuele annotatie
- manuele selectie & compositie
naar
“Dracula Distilled” - automatische annotatie
- automatische selectie & compositie
16/17
Coming soon!
ELIS - Multimedia Lab
Distilled
Volg de voortgang op: http://semweb.mmlab.be
Contact: [email protected]
17/17