Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim...
Transcript of Vorlesung Semantic Web - Technische Universität …...Was ist das Semantic Web? Artikel von Tim...
Vorlesung Semantic Web
Vorlesung im Wintersemester 2012/2013Dr. Heiko PaulheimFachgebiet Knowledge Engineering
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 2
Einführung
Was ist das Semantic Web? Bausteine des Semantic Web Grundlagen: URIs, Unicode, XML
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 3
Was ist das Semantic Web?
Artikel von Tim Berners-Lee, Jim Hendler, und Ora Lassila:
„The Web is the killer app of the Internet.The Semantic Web is another killer appof that magnitude.“
Berners-Lee et al. (2001): The Semantic Web. In: Scientific American, Mai 2001.
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 4
Web vs. Internet?
Chin-Shiuh Shieh (2000): TCP/IP - Internet Protocol Suite and Ethernet. http://bit.kuas.edu.tw/~csshieh/teach/np/tcpip/index.html
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 5
Das „klassische“ Web
HTTP-Protokoll URLs HTML als Auszeichnungssprache plus CSS, JavaScript, … plus weitere mehr oder weniger standardisierte Formate
(GIF, JPEG, Flash, …)
Browser als universeller Client
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 6
Das „klassische“ Web
Hypertext: verlinkte DokumenteDas World Wide Web
Der Grundstein für das World Wide Web wurde in den 90er-Jahren durch Tim Berners-Leeam CERN gelegt. ...
Tim Berners-Lee
Tim Berners-Lee (geboren 1955) gilt als einer der Erfinderdes World Wide Web. ...
CERN
Das CERN ist ein europäischesForschungszentrum in der Nähevon Genf. ...
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 7
Eine kurze Geschichte des Webs
Was wissen Sie über die Geschichte des Webs? Versuchen Sie, die folgenden Ereignisse zu ordnen:
12.Erste Version von Internet Explorer
13.Gründung von Google14.Erste Domain registriert15.Erste Version von Firefox16.TCP/IP-Standard17.1.000 Computer am Netz18.1.000.000 Computer am Netz19.1.000.000.000 Computer am
Netz20.Erstes Multi-User-Game im
Netz
1.Erste HTML-Version2.Wikipedia geht online3.Gründung von Skype4.Erster Web-Katalog5.Gründung des W3C6.Erste Volltext-Suchmaschine7.Gründung von Twitter8.HTTP-Standard9.500 Webserver am Netz10.Gründung von Facebook11.Dotcom-Blase und
Börsencrash
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 8
Eine kurze Geschichte des Webs
1974: TCP/IP-Standard 1979: Erstes Multi-User-Game 1985: Erste Domains registriert, ~1.000 Computer am Netz 1989: Hypertext-Konzept von Tim Berners-Lee am CERN 1991: Erste HTML-Version (20 Elemente) 1992: ~1.000.000 Computer am Netz 1993: Mosaic-Browser, ca. 500 Webserver (weltweit) 1994: Volltext-Suchmaschinen (WebCrawler, Lycos),
Web-Kataloge (Yahoo, AltaVista), Gründung des W3C
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 9
Eine kurze Geschichte des Webs
1995: Internet Explorer 1996: HTTP-Standard 1998: Google 2000: Dotcom-Börsencrash 2001: Wikipedia 2003: Skype 2004: Facebook, Firefox 2006: Twitter, WikiLeaks …
...1.000.000.000 Computer sind bis jetzt nicht am Netz!
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 10
Wachstum des Webs
http://de.wikipedia.org/w/index.php?title=Datei:NASDAQ_IXIC_-_dot-com_bubble.png&filetimestamp=20050426161953
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 11
Der Dotcom-Börsencrash
http://de.wikipedia.org/w/index.php?title=Datei:NASDAQ_IXIC_-_dot-com_bubble.png&filetimestamp=20050426161953
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 12
Das "klassische" Web
http://www.phdcomics.com/comics.php?n=1456
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 13
Das „klassische“ Web
<html> … <b>Dr. Mark Smith</b> <i>Physician</i> Main St. 14 Smalltown Mon-Fri 9-11 am Wed 3-6 pm …</html>
Print in bold: „hmf298hmmhudsa“Print in italics: „mj2i9ji0“Print normal: „fdsah 02hfadsh0um2m0adsmf0ihmasdfjköfdsa298ndsfmij32miolk2mjpoimjiofdpmsajiomjm“
Dr. Mark SmithPhysicianMain St. 14SmalltownMon-Fri 9-11 amWed 3-6 pm
aus Sicht desMenschen:
aus Sicht desComputers:
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 14
Informationssuche im Web
Volltextsuche nach Stichwörtern (z.B. Google): „Mark Smith“ „Physician in Smalltown“ „Doctor in Smalltown“ „Physician in Smalltown with opening hours
on Wednesday afternoon“ „Somebody in Smalltown who can fix
a broken leg“
=> „klassisches“ Web für Suche zu unflexibel=> intelligente Agenten können es nicht nutzen
<html> … <b>Dr. Mark Smith</b> <i>Physician</i> Main St. 14 Smalltown Mon-Fri 9-11 am Wed 3-6 pm …</html>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 15
http://geekandpoke.typepad.com/geekandpoke/2011/08/coders-love-unicode.html
Probleme des Web
Informationen finden Stichwortbasierte Textsuche statt echter Fragen verschiedene natürliche Sprachen Homonyme/Polyseme Synonyme
Information verarbeiten Formate (Encodings, Bilder, Videos, PDFs, …)
Information verwerten Verteilt auf verschiedene Seiten Bsp.: Information zu Buchautor
auf Verlagsseite, Adresse auf Uni-Seite
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 16
Probleme des Web
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 17
Probleme des Web
Pfahls-Prozess: Richter rollen die Skandale der Ära Kohl neu auf
? ? ?
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 18
Beispiel: Wolfram Alpha
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 19
Beispiel: Wolfram Alpha
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 20
Lösungsansätze
WWW
Information für Maschinenaufbereiten
Informationenaus dem Web
extrahieren
Web Mining Semantic Web
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 21
Idee des Semantic Web
Information in maschinenlesbarer Form bereitstellen
(Semantische) Verweise zwischen Seiten nutzbar machen
Schlussfolgern ermöglichen
Komplexe (nützliche!) Abfragen ermöglichen
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 22
Semantic Web – Aufbau
Berners-Lee (2009): Semantic Web and Linked Datahttp://www.w3.org/2009/Talks/0120-campus-party-tbl/
Technische Grundlagen
Semantic-Web-Technologie
(Fokus der Vorlesung)
here be dragons...
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 23
Uniform Resource Identifiers (URIs)
Als „Universal Resource Identifier“ erstmals vorgeschlagenvon Tim Berners-Lee (1994): IETF RFC 1630
Standard: IETF RFC 3986 (2005)
Dienen zur Benennung und zum Auffinden von Ressourcen im Internet
URI = scheme ":" hier-part [ "?" query ][ "#" fragment ]
http://example.com:8042/over/there?name=ferret#nose
authority path
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 24
URIs und URLs
Uniform Resource Locators (IETF RFC 1738, 1994) sind eine Untermenge von URIs
URIs können beliebige Dinge mit beliebigen Namen versehen ein URL ist der Name einer Resource [im Internet]
URL-typische Präfixe: http ftp mailto telnet file …
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 25
URLs im Web
Das World Wide Web
Der Grundstein für das World Wide Web wurde in den 90er-Jahren durch Tim Berners-Leeam CERN gelegt. ...
Tim Berners-Lee
Tim Berners-Lee (geboren 1955) gilt als einer der Erfinderdes World Wide Web. ...
http://www.w3.org/People/Berners-Lee/
http:/
/www.w
3.org/
WWW/
Häufigste Verwendung:(HTTP-)Links
Links haben in der Regelkeine Metainformation!
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 26
Zeichensätze im Web
ASCII („American Standard Code for Information Interchange“)ISO 646 (1963), 127 Zeichen, davon 95 druckbar: !"#$%&'()*+,-./0123456789:;<=>?
@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
`abcdefghijklmnopqrstuvwxyz{|}~
Erweiterung auf 8 Bit: ISO 8859-1 bis -16(1998) deckt Zeichen der europäischen Sprachen ab bekannt ist insbesondere 8859-1 („Latin-1“)
Das Web spricht aber viel mehr Sprachen...
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 27
Unicode
ISO 10646 erste Version 1991 (Europa, Nahost, Indien) Version 6.0 im Oktober 2010 17 Codebereiche à 16 Bit deckt selbst exotischste Sprachen ab
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 28
Unicode
Quelle: Wikimedia Commons
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 29
Informationsrepräsentation in XML
XML (eXtensible Markup Language) Standardisiert vom W3C (1998) Universelles Datenaustauschformat
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 30
XML: Konzepte
Tags (beliebig definierbar): Paare:
<physician> … </physician> Empty-Element-Tags:
<young />
Attribute:<physician location=“Smalltown“>
Schachtelung (genau ein Root-Element!):<physician>
<address> … </address></physician>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 31
XML: wohlgeformte Dokumente
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> <telephone> <number>+44 123 456789</number> </address> </telephone> <hours> <monday>9-11 am <tuesday>9-11 am</tuesday> ... </hours></physician>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 32
HTML und XML
HTML-Dokumente sind i.d.R. keine wohlgeformten XML-Dokumente!
<p> Look at this! <img src=smiley.gif> <br>
XHTML: HTML als wohlgeformte XHTML-Dateien Vom W3C standardisiert (seit 2000)
<p> Look at this! <img src=“smiley.gif“/> <br/> </p>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 33
XPath: Zugriff auf XML-Daten
Abfragesprache für XML Standardisiert vom W3C (1999, Version 2.0: 2010)/physician[name='Dr. Mark Smith']/telephone/number
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 34
XSLT: Transformation von XML-Dokumenten
Verarbeitung von XML-Dokumenten basierend auf Stylesheets Standardisiert vom W3C (1999) Verwendet XPath
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<xsl:template match=“/pyhsician“> <b> <xsl:value-of select=“name“/> </b><xsl:template/>
<b>Dr. Mark Smith</b>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 35
Namensräume in XML
Elemente gleichen Namens können mehrfach vorkommen ...aber mit anderem Inhalt (und anderer Semantik!) Wie können wir solche Elemente unterscheiden?
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 36
Namensräume in XML
<physician xmlns =“http://www.med.com/physician“ xmlns:addr=“http://www.med.com/addr“> <name>Dr. Mark Smith</name> <addr:address> <addr:street>Main St.</addr:street> <addr:number>14</addr:number> <addr:city>Smalltown</addr:city> </addr:address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
Mit Präfix unterscheidbar (Schreibweise: prefix:name) Ein Namensraum ist ein URI Default-Namensraum möglich
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 37
XML: Document Type Definition (DTD)
Definiert gültige Elemente für einen XML-Dokumenttyp Name zulässige Attribute zulässige Kind-Elemente
DTD ist Teil der W3C-XML-Spezifikation
XML-Dokumente, die auf eine DTD passen, heißen „gültig“
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 38
XML: Document Type Definition (DTD)
<!DOCTYPE physician SYSTEM “physician.dtd“>
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<!DOCTYPE physician [
<!ELEMENT physician ( name, address*, telephone?, fax?, hours)>
<!ELEMENT address ( street, number, city)>
<!ELEMENT street (#PCDATA)>
...
]>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 39
XML: Document Type Definition (DTD)
Definition von Kind-Elementen und deren Reihenfolge:<!ELEMENT address(street,nr,addtl*,zip,city,state?) > ? und * markieren optionale und wiederholbare Elemente
Definition von Attributlisten:<!ATTLIST person title CDATA> mögliche Zusätze: #REQUIRED, #FIXED, #IMPLIED, “...“ Aufzählung zulässiger Werte: (dr|prof)
Definition von Entitäten:<!ENTITY sw “Semantic Web“> Können als Abkürzung verwendet werden: &sw;
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 40
XML Schema
W3C-Standard (seit 2004) XML-Schema-Dateien sind selbst XML-Dateien
Flexibler als DTDs: Minimale und maximale Anzahl von Elementen Kombinationen von Elementen (entweder oder, Auswahl ohne
Reihenfolge, …) Datentypen (Zahlen, Daten, …), eigene Definitionen möglich Unterstützung von Namespaces Modulare Schemata möglich
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 41
XML Schema
<physician xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="physician.xsd"> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name=“physician“> <xs:complexType> <xs:sequence> <xs:element name=“name“ type=“xs:string“> <xs:element name=“address“> <xs:complexType> <xs:sequence> <xs:element name=“street“ type=“xs:string“> ... </xs:sequence> </xs:complexType> </xs:element> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 42
XML Schema – modulare Schemata
<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema"xmlns:addr="http://www.address.com/">
<xs:import namespace="http://www.address.com/" schemaLocation="address.xsd"/> <xs:element name=“physician“> <xs:complexType> <xs:sequence> <xs:element name=“name“ type=“xs:string“> <xs:element ref=“addr:address“ /> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>
<xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name=“address“> <xs:complexType> <xs:sequence> <xs:element name=“street“ type=“xs:string“> ... </xs:sequence> </xs:complexType> </xs:element></xs:schema>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 43
Beispiel: Modulare Schemata in XHTML
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:svg="http://www.w3.org/2000/svg"> <body> <h1>SVG embedded inline in XHTML:</h1> <svg:svg width="300px" height="200px"> <svg:circle cx="150" cy="100" r="50" fill="#ff0000"/> </svg:svg> </body></html>
https://developer.mozilla.org/En/SVG:Namespaces_Crash_Course
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 44
RELAX NG
Alternative zu XML Schema Standardisiert (ISO/IEC 19757-2, 2003)
Unterschiede zu XML Schema: weniger flexibel in Kardinalitäten kein expliziter Link zwischen XML-Dokument und Schema kein eigenes Typsystem (kann XML Schema Datatypes verwenden) bessere Unterstützung von schwach strukturierten Inhalten XML-basierte und kompakte Darstellung möglich
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 45
RELAX NG
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<element name="physician" xmlns="http://relaxng.org/ns/structure/1.0"> <element name="address"> <group> <element name="street"> <text/> </element> <element name="number"> <text/> </element> <element name="city"> <text/> </element> </group> </element> ...</element>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 46
Schematron
Fokus: Validierung von XML-Dokumenten Standardisiert (ISO/IEC 19757-3, 2006)
Verwendet Regeln zur Validierung Regeln basieren auf XPath-Ausdrücken Ausführung der Validierung mit XSLT möglich Fehlermeldungen werden direkt im Schema definiert
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 47
Schematron
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<?xml version="1.0" encoding="utf-8"?><schema xmlns="http://purl.oclc.org/dsdl/schematron" <title>Physician valididation schema</iso:title>
<pattern> <rule context="physician"> <assert test="address">A physician must have an address</assert> ... <assert test="hours/*">Hours must not be empty </assert> </rule> </pattern><schema>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 48
Schematron – Ausführung
Eddie Robertson: Combining Schematron with other XML Schema Languages.http://www.topologi.com/resources/schtrn_xsd_paper.html
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 49
XML Schema, DTD & Co –Was wird hier definiert?
Syntax – σύνταξις („zusammen“ + „Ordnung“) Welche Elemente gibt es? Wie werden sie angeordnet? Welche Kombinationen sind zulässig?
Gegensatz: Semantik - σημαίνειν („bezeichnen“) Wie interpretiert man den Inhalt von Elementen? In welchem inhaltlichen Zusammenhang stehen Elemente?
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 50
Syntax und Semantik:Exkurs in die Sprachwissenschaft
Syntax: wie bildet man korrekte Wörter und Sätze?
„Dieser Satz kein Verb.“
„Die träumende Lampe schenkst schenkt dem müden Wasserhahn unaufmerksam eine einen abgesägten Saft.“
Semantik: was bedeutet ein Wort/Satz/Text?
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 51
Syntax und Semantik:Exkurs in die Sprachwissenschaft
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 52
XML Schema, DTD & Co –Was wird hier definiert?
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
<physician> <name>Dr. Mark Smith</name> <address> <street>Main St.</street> <number>14</number> <city>Smalltown</city> </address> <telephone> <number>+44 123 456789</number> </telephone> <hours> <monday>9-11 am</monday> <tuesday>9-11 am</tuesday> ... </hours></physician>
Personalverzeichnisdes Krankenhauses:
Gelbe Seiten:
?=
(wahrscheinlich) die Privatadresse
(wahrscheinlich)die Adresse der Praxis
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 53
XML Schema, DTD & Co –Was wird hier definiert?
XML Schema / DTD definiert die Syntax eines XML-Dokuments, nicht die Semantik
Tag-Namen sind für Maschinen nicht a priori interpretierbar das macht die Informationssuche
nicht leichter... Semantik der Daten (ver-)steckt
hart verdrahtet in der Anwendung
Das Semantic Web soll hierAbhilfe schaffen Semantic Web ist/kann mehr als XML!
<2nf3oiü*> <34f0>Dr. Mark Smith</34f0> <rmd4935r> <e2m4>Main St.</e2m4> <dur3>14</dur3> <jfa34>Smalltown</jfa34> </rmd4935r> <d24r3fmö> <deß5>+44 123 456789</deß5> </d24r3fmö> <vsfif> <f02>9-11 am</f02> <fj9>9-11 am</fj9> ... </vsfif></2nf3oiü*>
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 54
Zusammenfassung
Probleme des klassischen Web Nicht für Maschinen nutzbar
URIs eindeutige Identifier für Ressourcen URL = dereferenzierbarer URI
Unicode ein einheitlicher Zeichensatz für alle
XML XPath XSLT Schemasprachen
23.10.12 | Fachbereich 20 | Knowledge Engineering | Heiko Paulheim | 55
Semantic Web – Aufbau
Berners-Lee (2009): Semantic Web and Linked Datahttp://www.w3.org/2009/Talks/0120-campus-party-tbl/
Technische Grundlagen
Semantic-Web-Technologie
(Fokus der Vorlesung)
here be dragons...
Vorlesung Semantic Web
Vorlesung im Wintersemester 2012/2013Dr. Heiko PaulheimFachgebiet Knowledge Engineering