Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim...

56
Vorlesung Semantic Web Vorlesung im Wintersemester 2012/2013 Dr. Heiko Paulheim Fachgebiet Knowledge Engineering

Transcript of Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim...

Page 1: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

Vorlesung Semantic Web

Vorlesung im Wintersemester 2012/2013Dr. Heiko PaulheimFachgebiet Knowledge Engineering

Page 2: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 2

Einführung

Was ist das Semantic Web? Bausteine des Semantic Web Grundlagen: URIs, Unicode, XML

Page 3: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 3

Was ist das Semantic Web?

Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila:

„The Web is the killer app of the Internet.The Semantic Web is another killer appof that magnitude.“

Berners-Lee et al. (2001): The Semantic Web. In: Scientific American, Mai 2001.

Page 4: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 4

Web vs. Internet?

Chin-Shiuh Shieh (2000): TCP/IP - Internet Protocol Suite and Ethernet. http://bit.kuas.edu.tw/~csshieh/teach/np/tcpip/index.html

Page 5: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 5

Das „klassische“ Web

HTTP-Protokoll URLs HTML als Auszeichnungssprache plus CSS, JavaScript, … plus weitere mehr oder weniger standardisierte Formate

(GIF, JPEG, Flash, …)

Browser als universeller Client

Page 6: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 6

Das „klassische“ Web

Hypertext: verlinkte DokumenteDas World Wide Web

Der Grundstein für das World Wide Web wurde in den 90er-Jahren durch Tim Berners-Leeam CERN gelegt. ...

Tim Berners-Lee

Tim Berners-Lee (geboren 1955) gilt als einer der Erfinderdes World Wide Web. ...

CERN

Das CERN ist ein europäischesForschungszentrum in der Nähevon Genf. ...

Page 7: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 7

Eine kurze Geschichte des Webs

Was wissen Sie über die Geschichte des Webs? Versuchen Sie, die folgenden Ereignisse zu ordnen:

12.Erste Version von Internet Explorer

13.Gründung von Google14.Erste Domain registriert15.Erste Version von Firefox16.TCP/IP-Standard17.1.000 Computer am Netz18.1.000.000 Computer am Netz19.1.000.000.000 Computer am

Netz20.Erstes Multi-User-Game im

Netz

1.Erste HTML-Version2.Wikipedia geht online3.Gründung von Skype4.Erster Web-Katalog5.Gründung des W3C6.Erste Volltext-Suchmaschine7.Gründung von Twitter8.HTTP-Standard9.500 Webserver am Netz10.Gründung von Facebook11.Dotcom-Blase und

Börsencrash

Page 8: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 8

Eine kurze Geschichte des Webs

1974: TCP/IP-Standard 1979: Erstes Multi-User-Game 1985: Erste Domains registriert, ~1.000 Computer am Netz 1989: Hypertext-Konzept von Tim Berners-Lee am CERN 1991: Erste HTML-Version (20 Elemente) 1992: ~1.000.000 Computer am Netz 1993: Mosaic-Browser, ca. 500 Webserver (weltweit) 1994: Volltext-Suchmaschinen (WebCrawler, Lycos),

Web-Kataloge (Yahoo, AltaVista), Gründung des W3C

Page 9: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 9

Eine kurze Geschichte des Webs

1995: Internet Explorer 1996: HTTP-Standard 1998: Google 2000: Dotcom-Börsencrash 2001: Wikipedia 2003: Skype 2004: Facebook, Firefox 2006: Twitter, WikiLeaks …

...1.000.000.000 Computer sind bis jetzt nicht am Netz!

Page 10: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 10

Wachstum des Webs

http://de.wikipedia.org/w/index.php?title=Datei:NASDAQ_IXIC_-_dot-com_bubble.png&filetimestamp=20050426161953

Page 11: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 11

Der Dotcom-Börsencrash

http://de.wikipedia.org/w/index.php?title=Datei:NASDAQ_IXIC_-_dot-com_bubble.png&filetimestamp=20050426161953

Page 12: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 12

Das "klassische" Web

http://www.phdcomics.com/comics.php?n=1456

Page 13: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 13

Das „klassische“ Web

<html> … <b>Dr. Mark Smith</b> <i>Physician</i> Main St. 14 Smalltown Mon-Fri 9-11 am Wed 3-6 pm …</html>

Print in bold: „hmf298hmmhudsa“Print in italics: „mj2i9ji0“Print normal: „fdsah 02hfadsh0um2m0adsmf0ihmasdfjköfdsa298ndsfmij32miolk2mjpoimjiofdpmsajiomjm“

Dr. Mark SmithPhysicianMain St. 14SmalltownMon-Fri 9-11 amWed 3-6 pm

aus Sicht desMenschen:

aus Sicht desComputers:

Page 14: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 14

Informationssuche im Web

Volltextsuche nach Stichwörtern (z.B. Google): „Mark Smith“ „Physician in Smalltown“ „Doctor in Smalltown“ „Physician in Smalltown with opening hours

on Wednesday afternoon“ „Somebody in Smalltown who can fix

a broken leg“

=> „klassisches“ Web für Suche zu unflexibel=> intelligente Agenten können es nicht nutzen

<html> … <b>Dr. Mark Smith</b> <i>Physician</i> Main St. 14 Smalltown Mon-Fri 9-11 am Wed 3-6 pm …</html>

Page 15: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 15

http://geekandpoke.typepad.com/geekandpoke/2011/08/coders-love-unicode.html

Probleme des Web

Informationen finden Stichwortbasierte Textsuche statt echter Fragen verschiedene natürliche Sprachen Homonyme/Polyseme Synonyme

Information verarbeiten Formate (Encodings, Bilder, Videos, PDFs, …)

Information verwerten Verteilt auf verschiedene Seiten Bsp.: Information zu Buchautor

auf Verlagsseite, Adresse auf Uni-Seite

Page 16: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 16

Probleme des Web

Page 17: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 17

Probleme des Web

Pfahls-Prozess: Richter rollen die Skandale der Ära Kohl neu auf

? ? ?

Page 18: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 18

Beispiel: Wolfram Alpha

Page 19: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 19

Beispiel: Wolfram Alpha

Page 20: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 20

Lösungsansätze

WWW

Information für Maschinenaufbereiten

Informationenaus dem Web

extrahieren

Web Mining Semantic Web

Page 21: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 21

Idee des Semantic Web

Information in maschinenlesbarer Form bereitstellen

(Semantische) Verweise zwischen Seiten nutzbar machen

Schlussfolgern ermöglichen

Komplexe (nützliche!) Abfragen ermöglichen

Page 22: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 22

Semantic Web – Aufbau

Berners-Lee (2009): Semantic Web and Linked Datahttp://www.w3.org/2009/Talks/0120-campus-party-tbl/

Technische Grundlagen

Semantic-Web-Technologie

(Fokus der Vorlesung)

here be dragons...

Page 23: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 23

Uniform Resource Identifiers (URIs)

Als „Universal Resource Identifier“ erstmals vorgeschlagenvon Tim Berners-Lee (1994): IETF RFC 1630

Standard: IETF RFC 3986 (2005)

Dienen zur Benennung und zum Auffinden von Ressourcen im Internet

URI = scheme ":" hier-part [ "?" query ][ "#" fragment ]

http://example.com:8042/over/there?name=ferret#nose

authority path

Page 24: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 24

URIs und URLs

Uniform Resource Locators (IETF RFC 1738, 1994) sind eine Untermenge von URIs

URIs können beliebige Dinge mit beliebigen Namen versehen ein URL ist der Name einer Resource [im Internet]

URL-typische Präfixe: http ftp mailto telnet file …

Page 25: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 25

URLs im Web

Das World Wide Web

Der Grundstein für das World Wide Web wurde in den 90er-Jahren durch Tim Berners-Leeam CERN gelegt. ...

Tim Berners-Lee

Tim Berners-Lee (geboren 1955) gilt als einer der Erfinderdes World Wide Web. ...

http://www.w3.org/People/Berners-Lee/

http:/

/www.w

3.org/

WWW/

Häufigste Verwendung:(HTTP-)Links

Links haben in der Regelkeine Metainformation!

Page 26: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 26

Zeichensätze im Web

ASCII („American Standard Code for Information Interchange“)ISO 646 (1963), 127 Zeichen, davon 95 druckbar: !"#$%&'()*+,-./0123456789:;<=>?

@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_

`abcdefghijklmnopqrstuvwxyz{|}~

Erweiterung auf 8 Bit: ISO 8859-1 bis -16(1998) deckt Zeichen der europäischen Sprachen ab bekannt ist insbesondere 8859-1 („Latin-1“)

Das Web spricht aber viel mehr Sprachen...

Page 27: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 27

Unicode

ISO 10646 erste Version 1991 (Europa, Nahost, Indien) Version 6.0 im Oktober 2010 17 Codebereiche à 16 Bit deckt selbst exotischste Sprachen ab

Page 28: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 28

Unicode

Quelle: Wikimedia Commons

Page 29: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 29

Informationsrepräsentation in XML

XML (eXtensible Markup Language) Standardisiert vom W3C (1998) Universelles Datenaustauschformat

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

Page 30: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 30

XML: Konzepte

Tags (beliebig definierbar): Paare:

<physician> … </physician> Empty-Element-Tags:

<young />

Attribute:<physician location=“Smalltown“>

Schachtelung (genau ein Root-Element!):<physician>

<address> … </address></physician>

Page 31: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 31

XML: wohlgeformte Dokumente

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> <telephone> <number>+44 123 456789</number> </address> </telephone> <hours> <monday>9-11 am <tuesday>9-11 am</tuesday> ... </hours></physician>

Page 32: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 32

HTML und XML

HTML-Dokumente sind i.d.R. keine wohlgeformten XML-Dokumente!

<p> Look at this! <img src=smiley.gif> <br>

XHTML: HTML als wohlgeformte XHTML-Dateien Vom W3C standardisiert (seit 2000)

<p> Look at this! <img src=“smiley.gif“/> <br/> </p>

Page 33: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 33

XPath: Zugriff auf XML-Daten

Abfragesprache für XML Standardisiert vom W3C (1999, Version 2.0: 2010)/physician[name='Dr. Mark Smith']/telephone/number

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

Page 34: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 34

XSLT: Transformation von XML-Dokumenten

Verarbeitung von XML-Dokumenten basierend auf Stylesheets Standardisiert vom W3C (1999) Verwendet XPath

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<xsl:template match=“/pyhsician“> <b> <xsl:value-of select=“name“/> </b><xsl:template/>

<b>Dr. Mark Smith</b>

Page 35: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 35

Namensräume in XML

Elemente gleichen Namens können mehrfach vorkommen ...aber mit anderem Inhalt (und anderer Semantik!) Wie können wir solche Elemente unterscheiden?

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

Page 36: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 36

Namensräume in XML

<physician xmlns =“http://www.med.com/physician“ xmlns:addr=“http://www.med.com/addr“> <name>Dr. Mark Smith</name> <addr:address> <addr:street>Main St.</addr:street> <addr:number>14</addr:number> <addr:city>Smalltown</addr:city> </addr:address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

Mit Präfix unterscheidbar (Schreibweise: prefix:name) Ein Namensraum ist ein URI Default-Namensraum möglich

Page 37: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 37

XML: Document Type Definition (DTD)

Definiert gültige Elemente für einen XML-Dokumenttyp Name zulässige Attribute zulässige Kind-Elemente

DTD ist Teil der W3C-XML-Spezifikation

XML-Dokumente, die auf eine DTD passen, heißen „gültig“

Page 38: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 38

XML: Document Type Definition (DTD)

<!DOCTYPE physician SYSTEM “physician.dtd“>

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<!DOCTYPE physician [

<!ELEMENT physician ( name, address*, telephone?, fax?, hours)>

<!ELEMENT address ( street, number, city)>

<!ELEMENT street (#PCDATA)>

...

]>

Page 39: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 39

XML: Document Type Definition (DTD)

Definition von Kind-Elementen und deren Reihenfolge:<!ELEMENT address(street,nr,addtl*,zip,city,state?) > ? und * markieren optionale und wiederholbare Elemente

Definition von Attributlisten:<!ATTLIST person title CDATA> mögliche Zusätze: #REQUIRED, #FIXED, #IMPLIED, “...“ Aufzählung zulässiger Werte: (dr|prof)

Definition von Entitäten:<!ENTITY sw “Semantic Web“> Können als Abkürzung verwendet werden: &sw;

Page 40: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 40

XML Schema

W3C-Standard (seit 2004) XML-Schema-Dateien sind selbst XML-Dateien

Flexibler als DTDs: Minimale und maximale Anzahl von Elementen Kombinationen von Elementen (entweder oder, Auswahl ohne

Reihenfolge, …) Datentypen (Zahlen, Daten, …), eigene Definitionen möglich Unterstützung von Namespaces Modulare Schemata möglich

Page 41: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 41

XML Schema

<physician xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="physician.xsd"> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">

<xs:element name=“physician“> <xs:complexType> <xs:sequence> <xs:element name=“name“ type=“xs:string“> <xs:element name=“address“> <xs:complexType> <xs:sequence> <xs:element name=“street“ type=“xs:string“> ... </xs:sequence> </xs:complexType> </xs:element> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>

Page 42: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 42

XML Schema – modulare Schemata

<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema"xmlns:addr="http://www.address.com/">

<xs:import namespace="http://www.address.com/" schemaLocation="address.xsd"/> <xs:element name=“physician“> <xs:complexType> <xs:sequence> <xs:element name=“name“ type=“xs:string“> <xs:element ref=“addr:address“ /> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>

<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">

<xs:element name=“address“> <xs:complexType> <xs:sequence> <xs:element name=“street“ type=“xs:string“> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>

Page 43: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 43

Beispiel: Modulare Schemata in XHTML

<html xmlns="http://www.w3.org/1999/xhtml" xmlns:svg="http://www.w3.org/2000/svg"> <body> <h1>SVG embedded inline in XHTML:</h1> <svg:svg width="300px" height="200px"> <svg:circle cx="150" cy="100" r="50" fill="#ff0000"/> </svg:svg> </body></html>

https://developer.mozilla.org/En/SVG:Namespaces_Crash_Course

Page 44: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 44

RELAX NG

Alternative zu XML Schema Standardisiert (ISO/IEC 19757-2, 2003)

Unterschiede zu XML Schema: weniger flexibel in Kardinalitäten kein expliziter Link zwischen XML-Dokument und Schema kein eigenes Typsystem (kann XML Schema Datatypes verwenden) bessere Unterstützung von schwach strukturierten Inhalten XML-basierte und kompakte Darstellung möglich

Page 45: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 45

RELAX NG

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<element name="physician" xmlns="http://relaxng.org/ns/structure/1.0"> <element name="address"> <group> <element name="street"> <text/> </element> <element name="number"> <text/> </element> <element name="city"> <text/> </element> </group> </element> ...</element>

Page 46: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 46

Schematron

Fokus: Validierung von XML-Dokumenten Standardisiert (ISO/IEC 19757-3, 2006)

Verwendet Regeln zur Validierung Regeln basieren auf XPath-Ausdrücken Ausführung der Validierung mit XSLT möglich Fehlermeldungen werden direkt im Schema definiert

Page 47: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 47

Schematron

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<?xml version="1.0" encoding="utf-8"?><schema xmlns="http://purl.oclc.org/dsdl/schematron" <title>Physician valididation schema</iso:title>

<pattern> <rule context="physician"> <assert test="address">A physician must have an address</assert> ... <assert test="hours/*">Hours must not be empty </assert> </rule> </pattern><schema>

Page 48: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 48

Schematron – Ausführung

Eddie Robertson: Combining Schematron with other XML Schema Languages.http://www.topologi.com/resources/schtrn_xsd_paper.html

Page 49: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 49

XML Schema, DTD & Co –Was wird hier definiert?

Syntax – σύνταξις („zusammen“ + „Ordnung“) Welche Elemente gibt es? Wie werden sie angeordnet? Welche Kombinationen sind zulässig?

Gegensatz: Semantik - σημαίνειν („bezeichnen“) Wie interpretiert man den Inhalt von Elementen? In welchem inhaltlichen Zusammenhang stehen Elemente?

Page 50: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 50

Syntax und Semantik:Exkurs in die Sprachwissenschaft

Syntax: wie bildet man korrekte Wörter und Sätze?

„Dieser Satz kein Verb.“

„Die träumende Lampe schenkst schenkt dem müden Wasserhahn unaufmerksam eine einen abgesägten Saft.“

Semantik: was bedeutet ein Wort/Satz/Text?

Page 51: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 51

Syntax und Semantik:Exkurs in die Sprachwissenschaft

Page 52: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 52

XML Schema, DTD & Co –Was wird hier definiert?

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>

Personalverzeichnisdes Krankenhauses:

Gelbe Seiten:

?=

(wahrscheinlich) die Privatadresse

(wahrscheinlich)die Adresse der Praxis

Page 53: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 53

XML Schema, DTD & Co –Was wird hier definiert?

XML Schema / DTD definiert die Syntax eines XML-Dokuments, nicht die Semantik

Tag-Namen sind für Maschinen nicht a priori interpretierbar das macht die Informationssuche

nicht leichter... Semantik der Daten (ver-)steckt

hart verdrahtet in der Anwendung

Das Semantic Web soll hierAbhilfe schaffen Semantic Web ist/kann mehr als XML!

<2nf3oiü*> <34f0>Dr. Mark Smith</34f0> <rmd4935r> <e2m4>Main St.</e2m4> <dur3>14</dur3> <jfa34>Smalltown</jfa34> </rmd4935r> <d24r3fmö> <deß5>+44 123 456789</deß5> </d24r3fmö> <vsfif> <f02>9-11 am</f02> <fj9>9-11 am</fj9> ... </vsfif></2nf3oiü*>

Page 54: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 54

Zusammenfassung

Probleme des klassischen Web Nicht für Maschinen nutzbar

URIs eindeutige Identifier für Ressourcen URL = dereferenzierbarer URI

Unicode ein einheitlicher Zeichensatz für alle

XML XPath XSLT Schemasprachen

Page 55: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 55

Semantic Web – Aufbau

Berners-Lee (2009): Semantic Web and Linked Datahttp://www.w3.org/2009/Talks/0120-campus-party-tbl/

Technische Grundlagen

Semantic-Web-Technologie

(Fokus der Vorlesung)

here be dragons...

Page 56: Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila: „The Web is the killer app of the Internet.

Vorlesung Semantic Web

Vorlesung im Wintersemester 2012/2013Dr. Heiko PaulheimFachgebiet Knowledge Engineering