UBU 3.0: semantisch web & linked data voor de UB?

Post on 20-Aug-2015

980 views 0 download

Transcript of UBU 3.0: semantisch web & linked data voor de UB?

UBU 3.0semantisch web & linked data voor de UB?

Eric Sieverts

sector Innovatie & Ontwikkeling

eric sieverts, UBU, april 2011

web 3.0

semantischweb

eric sieverts, UBU, april 2011

wat is die semantiek?

1. betekenis van de "aard" van de gegevens/informatie?(dit is een plaatsnaam, dit is een geboortedatum, …)

– betekenis & definitie van "veldnamen"– concordantie/mapping tussen "velden“ (DC:creator ≈ MARC:100)

of2. betekenis van inhoud van de informatie/gegevens?

(dit woord betekent in deze context ….; dit woord betekent hetzelfde als …. in dat document, …)

– betekenis & definitie van "veldinhouden"

(2011-04-07 betekent 7 april 2011 - volgens ISO8601)

allebei!eric sieverts, UBU, april 2011

hoe wordt die betekenis vastgelegd?

het toverwoord is ontologieënmaar in deze context kan "alles" een ontologie zijn

• elk metadatamodel (dus ook Dublin Core of MARC21)

• elk inhoudelijk beschrijvingsmodel (dus ook een thesaurus of een classificatie)

hoewel "echte" ontologieën nog wel iets meer zijn:

• leggen kennis geformaliseerd & gestructureerd vast

• in computerinterpreteerbare vorm

• zodanig dat computer op grond daarvan kan redeneren

eric sieverts, UBU, april 2011

zo wordt van "alles" de betekenis vastgelegd

maar dat moet wel volgens standaarden

hoe wordt die betekenis vastgelegd?

misschien is het toverwoord dus wel vooral

standaarden

(en het mooie is dat er daar zo veel van zijn)

eric sieverts, UBU, april 2011

vertel er dus wel bijwelke standaard

je gebruikt,als je er een gebruikt

standaardisatie van eigenschappen/kenmerkenin beschrijving van recepten

daardoor kanGoogle eenreceptenzoekmachinemaken

standaardisatie:metadatamodel is GR-ontologiebeschrijving van metadata in RDFa weergave van RDFa in (X)HTML

XML-jargondatabase jargon

semantic web jargon

lagenstructuur van gebruikte standaarden

eric sieverts, UBU, april 2011

ascii, utf-8, unicode, uri, ..

xml

rdf

metadatamodel

technische basisstructuren

weergeven van beschrijving

beschrijven van metadatabeschrijving

kennisorganisatiesysteem/ thesaurus / ontologie

skos beschrijvenvan metadatamodel

de "linked open data cloud" - 28 maart 2011 - 28,5 miljard gegevens onlinecomputers kunnen de betekenis van die data "begrijpen" & ze gebruiken

dankzij standardisatie van dataformats en metadata

from: State of the LOD cloud - 03/28/2011 - http://www4.wiwiss.fu-berlin.de/lodcloud/state/

maar zijn dat soort getallen alleen-zaligmakend ?

interoperabiliteitinteroperabiliteit

kern van semantisch web (en van linked data) is:kern van semantisch web (en van linked data) is:

… … ook tussen systemenook tussen systemendie daar niet bij voorbaat die daar niet bij voorbaat op waren gebouwdop waren gebouwd

interoperabiliteit

• door gebruik van ontologieën(en mapping/concordanties)

• door standaardisatie met RDF(en/of SPARQL)

eric sieverts, UBU, april 2011

RDF (en linked data)

• RDF = resource description framework• computerleesbare standaard beschrijving van metadata • waarbij telkens

– te beschrijven ding een webadres (URI) heeft– eigenschap van dat ding liefst ook een URI heeft– "waarde" van die eigenschap liefst ook een URI heeft

• voorbeeld:– boek (heeft een webadres: URI)– heeft auteur (betekenis van eigenschap ergens beschreven: URI)– persoon (gegevens van persoon ergens op web te vinden: URI)

RDF "triple stores"

eric sieverts, UBU, april 2011

RDF tripels

subject {predicaat} object

doc1 {heeft auteur} auth1

auth1 {heeft naam} john smith

auth1 {heeft affiliatie} home inc.

auth1 {heeft email} smith@home.com

grafische representatie vansimpel netwerk van 4 RDF-tripels

eric sieverts, UBU, april 2011

dezelfde RDF-tripels in XML

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns="http://www.john.smith.net/rdfexample/">

<rdf:Description rdf:about="http://www.xxx.com/yyy/doc1.xml">

<author>

<rdf:Description rdf:about="http://www.xxx.com/autId/7801">

<name>John Smith</name>

<affiliation>Home Inc.</affiliation>

<email>Smith@home.com</email>

</rdf:Description>

</author>

</rdf:Description>

</rdf:RDF>

namespaces

URI's van beschreven resources

eric sieverts, UBU, april 2011

wat kunnen /

moeten / willen

wij hiermee?

linked data

wat een organisatie zich moet afvragen

• wat hebben wij dat voor anderen interessant is?– catalogus, repository, collectie bijzondere collecties,

data in datasets in DVN [maar die data zijn NIET van ons!]

– voor wie is dat interessant? [moeten wij dat bedenken?]

– hoe stellen we dat beschikbaar? (RDF-tripels?)

– welke standaarden? (RDF, … ??)

• wat hebben anderen dat voor ons interessant is?• wat kan ik voor leuke toepassingen bedenken met

andermans data?– zeker als UKB besluit op te houden met de GOO?

eric sieverts, UBU, april 2011

wat een organisatie zich moet afvragen

• wat hebben wij dat voor anderen interessant is?

• wat kan ik voor leuke toepassingen bedenken met andermans data?

• wat hebben anderen dat voor ons interessant is?– wat voor data hebben we nodig?

[ìs er meer te bedenken dan verrijking met gegevens over auteurs, boeken, organisaties, onderwerpen, …?]

– hoe/waar vinden we die data? [DBpedia, andere bibliotheken, semantic radar in Firefox?]

eric sieverts, UBU, april 2011

dbpedia: data from Wikipedia

last.fm: artists

geonames:6.2 M toponyms

BBC: wildlifefinder

Flickr

project Gutenberg

IMDB

music brainz

rechtspraak.nl

Reuters:openCalais

viaf: virtual internationalauthority file

LCSH

NY times

wat een organisatie zich moet afvragen

• wat hebben wij dat voor anderen interessant is?

• wat kan ik voor leuke toepassingen bedenken met andermans data?

• wat hebben anderen dat voor ons interessant is?– wat voor data hebben we nodig?

[ìs er meer te bedenken dan verrijking met gegevens over auteurs, boeken, organisaties, onderwerpen, …?]

– hoe/waar vinden we die data? [DBpedia, andere bibliotheken, semantic radar in Firefox?]

– hoe moeilijk is het om die te gebruiken?– welke vaardigheden hebben we daarvoor nodig?

eric sieverts, UBU, april 2011

bestaan daar ookrecepten voor ?

…. en linked data zijn zeker niet binnen 15 minuten te bereiden ....