Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden....

16
1 - whitepaper - Ruimtelijke data op het web INHOUDSOPGAVE 2 Moeten we ruimtelijke data delen op het web? 6 Wat doet werkgroep OGC/ W3C? 10 Ruimtelijke data op het web; hoe zou het moeten werken? 13 Ruimte maken voor ruimtelijke data op het web

Transcript of Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden....

Page 1: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

1

- whitepaper -

Ruimtelijke data op het web

INHOUDSOPGAVE

2 Moeten we ruimtelijke data delen op het web?

6 Wat doet werkgroep OGC/ W3C?

10 Ruimtelijke data op het web; hoe zou het moeten werken?

13 Ruimte maken voor ruimtelijke data op het web

Page 2: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

2

Moeten we ruimtelijke data delen op

het web?

Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt

in concepten als Big Data, het Internet of Things, Machine Learning en de slimme leefomgevingen.

Maar om ze echt goed toe te passen, moet er nog wel wat gebeuren. Daarvoor is in 2014 de

Spatial Data on the Web Working Group (SDDWG) in het leven geroepen.

Frans Knibbe (Geodan Research) staat stil bij de waarde van het delen van ruimtelijke data op het

web. Daarnaast laat hij de noodzaak van samenwerking zien binnen de domeinen ruimtelijke data

en het web.

Wat is het web precies? In het alledaagse taalgebruik zijn het internet en het wereldwijde web (www) vaak uitwisselbare

begrippen. Toch zitten er wel degelijk verschillen in. Geboren uit een voorloper uit 1969 werd het

internet zoals we dat nu kennen in 1983 een feit. De basis van het internet is TCP/I P, een standaard

voor communicatie tussen computers. Het bestaan van het internet maakte het ontstaan van het

wereldwijde web (www of kortweg ‘het web’) mogelijk.

Het web is begonnen in 1991 en werd uitgevonden door Tim Berners-Lee, tegenwoordig directeur

van het World Wide Web Consortium (W3C). Het web kan niet bestaan zonder het internet; het is

een van de toepassingen die op het internet draaien (e-mail is een voorbeeld van een andere

toepassing). Ook het web is gebaseerd op standaarden. De belangrijkste zijn HTTP, een protocol

voor het uitwisselen van hypertext (tekst met hyperlinks, zoals dit blog), HTML, een

standaardformaat voor de opmaak van hypertext en de URL of URI (een universele identificatie van

resources).

De totstandkoming van het web maakte het mogelijk om op een universele wijze tekstdocumenten

te publiceren en te koppelen. Later werd naast tekst ook (stil of bewegend) beeld gedeeld via

webstandaarden en tegenwoordig kunnen webbrowsers zo veel dat ze als volwaardige

besturingssystemen (zoals Windows of Linux) kunnen worden beschouwd. Dat het web een enorme

invloed heeft gehad op de wereld is zacht uitgedrukt. Wereldwijde communicatie is drastisch

veranderd en op sociaal, economisch, cultureel en politiek gebied is de wereld door het web radicaal

veranderd. Ook het web zelf verandert mee.

Page 3: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

3

Er is een groeiende tendens om het web te gebruiken voor het delen van ruwe data. Ruwe data zijn

een bron van informatie en kennis. Ze liggen ten grondslag aan vele beslissingen die worden

gemaakt door bedrijven, overheden en burgers.

"Het web kan niet bestaan zonder het

internet; het is een van de toepassingen

die op het internet draaien"

Frans Knibbe

Ruimtelijke data: meer dan geo-data Data die iets zeggen over locatie zijn ruimtelijke data. En dat omvat meer dan alleen de geografische

data die traditioneel worden opgeslagen en gebruikt via Geografische Informatiesystemen (GIS). Om

te beginnen is het goed om te beseffen dat de aanduiding ‘ruimtelijk’ algemener is dan

‘geografisch’. Geografische data gebruiken de aarde, of een model van de aarde, als referentie.

Gegevens over locaties op andere hemellichamen zijn dus wel ruimtelijk, maar niet geografisch. Ook

gegevens over locaties die zich wel op aarde bevinden, maar geen aan de aarde gerelateerd

coördinaatsysteem gebruiken, zijn wel ruimtelijk maar niet geografisch.

Neem bijvoorbeeld een 3D-model van een gebouw. Vaak wordt een coördinaatsysteem gebruikt dat

niet direct aan de aarde te relateren is. Een andere vorm van ruimtelijke data werd genoemd in één

van de use cases voor de SDWWG: het beschrijven van vormen en ruimtelijke relaties in

microscoopplaatjes, ten behoeve van kankeronderzoek. Ruimtelijke data zijn dus niet beperkt tot de

menselijke schaal.

Verder is het goed te beseffen dat ruimtelijke data niet alleen in getallen (coördinaten) zijn uit te

drukken. Er bestaan ook andere manieren om locaties aan te duiden: bijvoorbeeld via namen

(toponiemen) of adressen.

Ten slotte bestaan er gegevens over locaties waarvan de locatie onbekend of vaag is. Als u iets weet

over geschiedenis, of ‘Asterix en het ijzeren schild’ heeft gelezen, zal de plaatsnaam Alesia u

Page 4: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

4

misschien bekend in de oren klinken. Het is een historische locatie, maar waar het precies was, daar

is men het nog niet over eens.

Een andere vorm van vaagheid treedt op bij hedendaagse begrippen als ‘het Midden-Oosten’, ‘de

Sahara’ of ‘de Randstad’: een goede definitie van de grens is niet te geven. Toch zijn het ruimtelijke

objecten. Of wat dacht u van ‘aan de overkant van de straat’ of ‘in mijn linkerbroekzak’? Allemaal

plaatsbepalingen. De laatste twee voorbeelden geven ook aan dat ruimtelijke gegevens meer

omvatten dan locaties vastleggen. Ook relaties tussen locaties zijn van belang en kunnen als data

worden vastgelegd of afgeleid uit locatiebepalingen. Voorbeelden hiervan zijn: ‘België grenst aan

Nederland’ of ‘Ik bevind mij op twintig kilometer van het dichtstbijzijnde tankstation’.

Holistische benadering werpt vruchten af Historisch gezien speelden ontwikkelingen in ruimtelijke data en webdata zich in aparte domeinen

af. Gelukkig is er tegenwoordig een trend van wederzijdse toenadering. Neem bijvoorbeeld de

toenemende populariteit van specificaties als GeoJSON (vectorgeometrie in JavaScript Object

Notation) en TopoJSON (een extensie op GeoJSON die geometrie topologisch opslaat). Of de steeds

verdergaande ontwikkeling van wat Google met geografische data doet. Toch spelen nog veel

ontwikkelingen binnen de aparte domeinen af. En dat is jammer, want door problemen zo holistisch

mogelijk te benaderen, boeken we de beste duurzame vooruitgang.

Vanuit een historisch GIS-perspectief is er een wens van schaalvergroting en van

interoperabiliteitsverhoging (het beter uitwisselen van gegevens van diverse digitale systemen). De

eerste generatie GIS kenmerkte zich door dataopslag in bestanden en formaten die verschillen per

GIS-pakket. De interoperabiliteit was laag; om gegevens van één pakket in het andere te gebruiken,

moest je de gegevens converteren, met alle rompslomp en risico’s van dien. Bij de tweede generatie

GIS kon je geografische gegevens opslaan in meer algemene relationele databases. Zodoende kon je

grotere datahoeveelheden gebruiken. Ondertussen konden meerdere soorten software de gegevens

gebruiken en kon je geografische data beter combineren met andersoortige data. En nu zijn we toe

aan een derde generatie GIS, waarbij alle data, ruimtelijk en niet-ruimtelijk, via één grote

wereldwijde gedistribueerde database worden gedeeld. Hier zal de meeste gebruikersinteractie via

webapplicaties plaatsvinden. Weer een grote stap vooruit op het gebied van schaal en

interoperabiliteit.

Kennis hard nodig Vanuit een historisch webperspectief is het toenemende belang van ruwe data te zien. Het web

ontwikkelt zich van een platform om documenten te delen tot een alomvattend IT-systeem. En

daarbij hoort een manier om ruwe data op te slaan, delen, combineren en ondervragen. Bij die

ontwikkeling is de kennis over ruimtelijke data die de laatste decennia in de GIS-wereld is

Page 5: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

5

opgebouwd onontbeerlijk. Om goed om te kunnen gaan met complexe objecten,

coördinaatsystemen, ruimtelijke relaties, ruimtelijke netwerken en dergelijke, is de kennis die

binnen organisaties als het OGC is opgebouwd hard nodig. Deze zal moeten worden uitgebuit.

SDDWG Samenvattend is het van groot belang dat ruimtelijke data goed op het web kunnen werken. Om dat

te realiseren is de Spatial Data on the Web Working Group (SDDWG) in het leven geroepen, een

gezamenlijk initiatief van het OGC en het W3C.

Page 6: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

6

Wat doet werkgroep OGC/ W3C?

Om het vrij delen van ruimtelijke data op het web mogelijk te maken, hebben het Open

Geospatial Consortium (OGC) en het Word Wide Web Consortium (W3C) in 2014 gezamenlijk een

werkgroep opgericht. Die werkgroep heeft als doel de standaarden te verbeteren en te

verduidelijken. En dat is hard nodig, weet Frans Knibbe van Geodan Research.

In een eerder blog schreef ik over de aard van ruimtelijke data, het belang van ruimtelijke data op

het web en het gegeven dat geo-informatie in een overgangsfase zit. Data hoeven niet langer in

afgesloten silo’s te zitten, maar kunnen vrij worden gedeeld. Het OGC en het W3C, belangrijke

organisaties voor respectievelijk geo-informatie en het wereldwijde web, snappen dat die overgang

in goede banen moet worden geleid. Vandaar de oprichting van een gezamenlijke werkgroep, de

Spatial Data on the Web Working Group (SDWWG). Dat was een unieke gebeurtenis: nooit eerder

werkten de OGC en W3C op die manier samen. Het was dan ook even zoeken naar een geschikte

vorm die paste bij beide organisaties, maar het is gelukt.

De missie Het formele document waarmee de doelen van de werkgroep zijn vastgelegd, is het handvest.

Daarin worden de missie en de op te leveren resultaten beschreven. In deze blog wil ik ingaan op die

doelstellingen. De SDWWG zet zich in voor het verbeteren en verduidelijken van standaarden voor

het omgaan met ruimtelijke data op het web. En dat is hard nodig, want het huidige aanbod van

standaarden is tamelijk onoverzichtelijk. Op sommige gebieden zijn er teveel standaarden,

bijvoorbeeld over hoe een vectorgeometrie (een geordende verzameling coördinaten) gecodeerd

kan worden. Op andere gebieden is er juist een tekort aan standaardisatie. Hoe naar een

coördinaatsysteem verwezen kan worden, is bijvoorbeeld niet duidelijk. Deze wanorde kan deels

verklaard worden door de alomtegenwoordigheid van ruimtelijke data. Het overgrote deel van data

die we op het web willen gebruiken, hebben ruimtelijke aspecten. Dat betekent dat iedereen die

iets met data wil doen ook iets met dat ruimtelijke aspect zou moeten doen. Velen hebben zich dus

al met standaardisatie van ruimtelijke data beziggehouden, vanuit een eigen domeinperspectief en

soms al voordat het web in beeld kwam als platform voor het uitwisselen van data.

Zo heeft het OGC voor geo-informatie-experts een uitgebreide verzameling aan standaarden, die

samen een complex en gesloten semantisch systeem vormen. Ook in andere domeinen heeft men

standaarden voor locatie ontwikkeld, om bijvoorbeeld een toponiem, een adres, of een puntlocatie

uit te drukken. Het web is echter een omgeving waar alle domeinen bij elkaar kunnen komen.

Page 7: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

7

Wat levert de werkgroep op? In het handvest staat beschreven wat de werkgroep van plan is op te leveren:

• Een document met gebruiksscenario’s en vereisten (use cases and

requirements);

• Een overzicht van best practices voor terbeschikkingstelling en consumptie van

ruimtelijke data op het web;

• Een verbeterde versie van de Time Ontology in OWL (een ontologie voor het

uitdrukken van gegevens over tijd);

• Een verbeterde versie van het Semantic Sensor Network Vocabulary;

• Een voorziening (vermoedelijk een ontologie) om coveragedata via het web te

delen;

Zowel het OGC als het W3C publiceren de resultaten, waarbij de laatste drie uit bovenstaand rijtje

een formelere status zullen hebben dan de eerste twee. Over elk van deze op te leveren resultaten

is wel iets interessants te melden.

Gebruiksscenario's en vereisten vormen fundament De gebruiksscenario’s en daaruit af te leiden vereisten zijn de basis voor het verdere werk. Daarom

heeft de werkgroep deze als eerste aangepakt en gepubliceerd. Zie hier de laatst gepubliceerde

versie. Dit document bevat beschrijvingen van verschillende soorten gebruik van ruimtelijke data op

het web. Daaruit is af te leiden wat er nodig is om het goed te laten werken. Een paar belangrijke

vereisten zijn:

• Eenduidige standaarden voor het vastleggen van ruimtelijke gegevens,

ruimtelijke relaties en ruimtelijke metadata;

• Het koppelbaar maken van ruimtelijke gegevens;

• Het vindbaar en doorzoekbaar maken van ruimtelijke gegevens op het web.

Best practices inventariseren De werkgroep is inmiddels best practices aan het verzamelen die een tweede document gaan

vormen. Hierin komt te staan hoe ruimtelijke data het beste op het web gepubliceerd, gevonden en

geconsumeerd kunnen worden. Dit op een laagdrempelige wijze, het is namelijk ook bestemd voor

mensen die af en toe, of zijdelings met ruimtelijke data te maken hebben. De werkgroep zoekt

daarbij uit in hoeverre de huidige praktijk van data op het web (o.a. gebruik van JSON en simpele,

Page 8: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

8

RESTvolle APIs) toepasbaar is op ruimtelijke data. Hiervoor inventariseert de werkgroep welke

standaarden en hulpmiddelen er nu zijn en hoe ruimtelijke data op het web nu worden

gepubliceerd. Bij overlap zal de werkgroep keuzes maken. Bij functionele gaten – sommige dingen

zijn nog op geen enkele manier goed te doen – zal de werkgroep zelf een oplossing zoeken,

bijvoorbeeld in de vorm van samenwerking met andere gemeenschappen om een bepaalde

websemantiek uit te breiden.

Temporele data Op het eerste gezicht lijkt het vreemd dat een werkgroep over ruimtelijke data zich ook met tijd

bezig houdt. Op niet-kosmisch niveau zijn ruimte en tijd immers eigenschappen die niet per se

samengaan: data kunnen tijdaspecten hebben, ruimtelijke aspecten, of beide. Toch zijn er redenen

te bedenken:

1. Standaarden voor publicatie van ruimtelijke data voldoen nu vaak niet voor

serieuze, professionele toepassingen van data door overheden of

onderzoeksinstituten. Die data hebben vaak ook een tijdaspect, bijvoorbeeld

doordat de dingen die worden beschreven veranderlijk zijn.

2. Ruimtelijke data delen is belangrijk in wetenschappen als geschiedenis,

archeologie en geologie. Eén van de verbeterpunten van de tijdontologie is

ondersteuning voor tijd die niet via de gregoriaanse kalender of ISO 8601 kan

worden uitgedrukt. Juist in historische wetenschappen zijn dat soort

uitdrukkingen nodig.

3. Het OGC heeft het concept tijd al gemodelleerd in diverse standaarden,

bijvoorbeeld voor tijdreeksen, die worden gezien als een soort coverage – een

type ruimtelijke data.

4. Er zit veel logische overlap tussen ruimte en tijd, hetgeen blijkt als bijvoorbeeld

de intervalalgebra van Allen wordt vergeleken met de DE-9IM. Overeenkomsten

in tijd en eendimensionale ruimte als in linear referencing zijn zo mogelijk nog

groter.

5. Vanwege onze onrustige aardkorst, waarbij platen continu bewegen, zijn

coördinaatsystemen voor geografie tijdsafhankelijk.

Semantisch Sensornetwerk verbeteren Sensoren hebben twee ruimtelijke aspecten. Ten eerste hebben ze een locatie, die vast of variabel

kan zijn, en ten tweede meten ze vaak een ruimtelijk fenomeen, zoals luchtvervuiling of de locatie

van personen in een ruimte. Standaarden voor sensordata worden dan ook uitgewerkt binnen het

OGC. En sinds 2011 is er een bruikbare standaard voor het Semantisch Web, het Semantic Sensor

Page 9: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

9

Network (SSN). Die standaard lijkt voor verbetering vatbaar: meer mogelijkheden en makkelijker te

gebruiken. Het resultaat zal moeten bijdragen aan een algemenere beschikbaarheid,

interoperabiliteit en bruikbaarheid van sensordata op het web. En dat biedt mogelijkheden voor

bijvoorbeeld het Internet of Things (of Web of Things) en het slimmer maken van onze

leefomgevingen.

"Het web zal dan, meer nog dan nu al

het geval is, dé plek worden om

gegevens te delen"

Frans Knibbe

Coveragedata op het web Coverage is een belangrijke vorm van ruimtelijke data die we laagdrempelig op het web moeten

kunnen delen. Een coverage is een verzameling data die een ruimte- en/of tijdvariabel fenomeen

beschrijven. Een coverage kan één tot vier dimensies bestrijken. Voorbeelden van coveragedata zijn

satellietbeelden, tomogrammen, tijdreeksen en puntenwolken. Het is een klasse van data die erg

belangrijk is voor onderzoek. Bijvoorbeeld het onderzoek naar milieu en klimaat. Het resultaat van

de werkzaamheden zal waarschijnlijk een formele ontologie voor coveragedata op het Web zijn, zo

veel mogelijk gebaseerd op bestaande en nog te ontwikkelen specificaties van het OGC, en wellicht

op het Data Cube Vocabulary voor multidimensionale data.

Ambitieus. Té Ambitieus? De doelstellingen zijn zeer ambitieus. Mocht de werkgroep ze halen, dan zal het web, nog meer dan

nu al het geval is, dé plek worden om gegevens te delen. Evengoed zullen de standaarden en best

practices goed inzetbaar zijn op intranetten om problemen met niet-deelbare data en slecht

gekoppelde systemen binnen organisaties te verhelpen. Maar zijn de doelstellingen te halen? De

groep heeft weliswaar zeventig experts in spatiotemporele data en/of webdata, maar het

merendeel doet mee als vrijwilliger en sommige problemen zijn erg lastig. De tijd zal het leren, maar

er is zeker hoop op bruikbare resultaten rond het einde van 2016.

Daarom gaat de werkgroep pragmatisch te werk door gebruik te maken van bestaande standaarden

en specificaties, en door samen te werken met andere gemeenschappen. Bovendien is het web een

Page 10: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

10

platform dat bestaat uit vele modules die slim met elkaar gecombineerd weer nieuwe dingen

opleveren. Mocht de werkgroep er niet in slagen alle doelstellingen en vereisten te realiseren, dan

zal het werk op zijn minst bouwstenen voortbrengen waarmee verder gebouwd kan worden.

Page 11: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

11

Ruimtelijke data op het web; hoe zou

het moeten werken?

Wat moet er gebeuren voordat ruimtelijke data zich als voorbeeldige en nuttige webbewoners

kunnen gedragen? Welke afspraken moeten we maken om de talrijke mogelijkheden van

ruimtelijke data op het web binnen handbereik te krijgen? Frans Knibbe, Geodan Research, gaat in

op het eisenpakket dat is samengesteld door de Spatial Data on the Web Working Group

(SDWWG), een gezamenlijk initiatief van het OGC en het W3C.

Dit is het derde blog van een serie over ruimtelijke data op het web. In het eerste deel beschreef ik

de waarde van het delen van ruimtelijke data op het web en de noodzaak van synthese van

domeinstandaarden om dat goed te doen. Iets dat de SDWWG moet verzorgen. In het tweede deel

beschrijf ik wat de SDWWG wil bereiken. In dit artikel behandel ik het eerste resultaat van deze

werkgroep, het overzicht van gebruiksscenario’s en de vereisten.

Use cases and requirements Het is een beproefde methode om te bepalen hoe een systeem tot stand moet komen: je verzamelt

verhalen van gebruikers die beschrijven hoe iets goed zou kunnen werken, of wat er nu níet goed

werkt. Uit die verhalen zijn systeemeisen af te leiden; afvinkbare en testbare eigenschappen van

hetgeen gemaakt moet worden. Deze methode is ook toegepast in de SDWWG. Eén van hun

deliverables, beschreven in het vorige blog, is een overzicht van gebruiksscenario’s en eisen. De

tweede publieke conceptversie hiervan is net gepubliceerd. Het bevat de basis voor de overige vier

resultaten:

• Best Practices

• Time Ontology

• Semantic Sensor Network Vocabulary

• Coverage in Linked Data

Het document bevat zo’n vijftig verschillende gebruikersscenario’s (use cases), en bijna zestig

vereisten (requirements) die daaruit volgen. Vooral de vereisten voor de Best Practices zijn

interessant, want die aanbevelingen zouden het antwoord moeten geven op de algemene vraag:

hoe kunnen we ruimtelijke data op het web het best publiceren en gebruiken? Een aantal

onderdelen van de vereisten sprong eruit:

Page 12: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

12

• Vindbaarheid

• Koppelbaarheid van data

• Onzekerheid

• Ruimtelijke relaties

• Metadata

• Coördinatenstelsels

Vindbaarheid Wat heb je aan data die wel ergens op het web staan maar die je niet kunt vinden? Niet veel.

Vindbaarheid is een logische eis die we aan ruimtelijke data op het web stellen. Een traditionele

manier om ruimtelijke data kenbaar te maken op het web is het publiceren van metadata in een

datacatalogus, bijvoorbeeld via de CSW-specificatie. Maar deze manier is niet optimaal. Als er iets

op het web wordt gezocht, maken we meestal gebruik van een zoekmachine, zoals Google. Het

indexeerbaar maken voor zoekmachines is daarom cruciaal. Een zoekmachine maakt gebruik van

een zogeheten crawler: een algoritme dat recursief hyperlinks volgt. Alles dat de crawler vindt, kan

geïndexeerd worden en is daarmee vindbaar. Voor een goede vindbaarheid van data moeten dus

niet alleen metadata worden gepubliceerd die de data goed beschrijven (het liefst op een algemene

webmanier), maar de data moeten onderling ook zodanig gekoppeld zijn dat een crawler zoveel

mogelijk kan vinden. Daarnaast helpt het wanneer data kunnen worden opgevraagd in een formaat

dat webcrawlers begrijpen, zoals HTML.

Koppelbaarheid Het heeft veel met vindbaarheid van data te maken: de mogelijkheden om data te koppelen en

verbanden te leggen tussen elementen binnen of tussen verschillende datasets. Het zijn

koppelingen (hyperlinks) die de draadjes van het web vormen. Ze vormen een essentieel onderdeel

van het web. Hoe beter iets gekoppeld is of gekoppeld kan worden, hoe nuttiger het is. Koppelingen

op het web kunnen tot stand gebracht worden via HTTP(S) URI’s. Als iets een URI heeft kan iets

anders ermee koppelen. Tegelijkertijd is er een manier om de achterliggende data op te vragen.

Namelijk via HTTP. Waarschijnlijk zal in de Best Practices worden aangeraden om aan ruimtelijke

data HTTP(S) URI’s toe te kennen. Dat geeft de mogelijkheid direct en expliciet data aan elkaar te

koppelen. Maar ook impliciete koppelingen kunnen waardevol zijn. Door op het web van

gemeenschappelijke datadefinities gebruik te maken, kunnen semantische koppelingen worden

gemaakt. Wanneer bijvoorbeeld in twee aparte datasets gebruikgemaakt wordt van een algemene

definitie van een administratief gebied (zoals https://schema.org/AdministrativeArea), is er een

verband tussen die datasets gemaakt.

Page 13: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

13

Onzekerheid Zowel bij ruimtelijke als temporele aspecten van data komt onzekerheid voor. Het kan verschillende

vormen hebben. Bij vectorgeometrie is het bijvoorbeeld de nauwkeurigheid van de getallen die die

coördinaten vormen. Tekstuele aanduidingen kunnen ook vaag of ambigu zijn. Neem de plaatsnaam

‘Bergen’. Er zijn alleen al in Nederland meerdere woonplaatsen die zo heten. En de ruimtelijke

eigenschappen van zo’n plaats veranderen ook nog eens met de tijd, dus zonder tijdsaanduiding zijn

namen van locaties hoe dan ook niet eenduidig tot ruimtelijke eigenschappen te herleiden.

Daarnaast hebben sommige plaatsen, zoals de Sahara, helemaal geen duidelijke ruimtelijke

afbakening. En wat te denken van aanduidingen van ruimtelijke relaties als ‘in de buurt van’ of

‘beneden de grote rivieren’? Wat we in ieder geval niet willen is dat data níet gedeeld worden

vanwege onzekerheid, of dat informatie over onzekerheid niet wordt gedeeld. Simpelweg omdat

het niet duidelijk is hoe onzekerheid aangegeven kan worden. Gegevens zullen altijd onzekerheden

hebben, maar dat betekent geenszins dat ze niet waardevol kunnen zijn. Het is dus belangrijk om

ruimtelijke en temporele onzekerheid goed uit te kunnen drukken wanneer data op het web worden

gepubliceerd.

Page 14: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

14

Ruimte maken voor ruimtelijke data op

het web

In de ideale wereld worden ruimtelijke data overal soepel gedeeld op het wereldwijde web.

Helaas is dit vooralsnog toekomstmuziek. Er is geen overeenstemming over de werkwijze van

ruimtelijke data op het web. En dat is wel nodig. In dit blog verkent Frans Knibbe, Geodan

Research, het potentieel van een nieuwe universele webstructuur voor ruimtelijke data.

Onlangs had ik het voorrecht mee te kunnen doen in discussies over hoe het web een betere plek

voor data kan worden, tijdens de jaarlijkse W3C-conferentie TPAC. Een nobel doel, want het delen

van allerlei soorten data kan de mensheid de kennis en wijsheid geven die het zo hard nodig heeft.

Voor het delen van ruwe data zijn al goede methoden gevonden. Zo zijn ze tegenwoordig een stuk

makkelijker te vinden, begrijpen, verwerken en combineren. Recente bewijzen hiervan zijn

bijvoorbeeld de Data on the Web Best Practices en een conceptaanbeveling van het W3C. Daarnaast

kwam Google met een handleiding over hoe wetenschappelijke datasets voorzien kunnen worden

van een geschikte context met termen uit schema.org om vindbaarheid te verhogen. Voor

ruimtelijke data in het bijzonder is de Spatial Data on the Web Working Group (SDWWG), waaraan

ook Geodan meedoet, bezig de algemene richtlijnen Data on the Web Best Practices uit te breiden

tot Best Practices for Spatial Data on the Web.

Ruimtelijke data Er is iets bijzonders aan de hand met ruimtelijke data op het web. Zou je de beste methodiek willen

selecteren, dan is er geen tekort aan praktijken om te evalueren. Kijk alleen maar naar de vele

manieren waarop geografische data (ruimtelijke data met een relatie tot het aardoppervlak) kunnen

worden gedeeld op het web. En het gaat verder, want ruimtelijke data zijn niet het exclusieve

domein van geografen. Aspecten van ruimtelijkheid zijn in vrijwel alle gebieden van menselijk

handelen aan te treffen. Zodoende zijn er vele domeingebonden manieren ontwikkeld om

ruimtelijke data uit te drukken. Alles bij elkaar is er een enorme hoeveelheid aan standaarden en

praktijken.

Ruimtelijke data zijn overal. Het zou zonde zijn als al die nuttige data in hun eigen donkere hoekjes

van het web blijven, zonder de mogelijkheid ze te combineren. Ruimte is, net als tijd, een universeel

fenomeen en hebben daardoor de potentie elkaar perfect aan te vullen. Als het zou lukken om al die

diverse gegevens op één lijn te krijgen, dan zou dat een ‘dataversum’ opleveren waaraan de

Page 15: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

15

stoutmoedige ruimteverkenner het hart kan ophalen. Helaas is ruimte echter nog geen goed

navigeerbare dimensie in het dataweb.

Een structuur voor ruimtelijkheid Wat er nodig lijkt te zijn is een universeel model van ruimtelijkheid. Iets dat simpel en krachtig is, en

klaar voor het web. Iets dat iedereen snel kan inzetten zonder al te veel aanpassingen aan

bestaande praktijken. In het handvest noemen we het ontwikkelen van een algemene ruimtelijke

structuur als doel. Daarom is de SDWWG begonnen met het ontwikkelen van een standaard

werkwijze voor ruimtelijke data op het web. Het idee is dat het een nieuwe versie van de huidige

ontologie van GeoSPARQL zal zijn. De nieuwe structuur zal verder uitgewerkte definities moeten

bevatten van de kernbegrippen voor ruimtelijke data. Zulke definities kunnen dan het fundament

zijn voor bijvoorbeeld:

• data-uitwisselingsformaten

• datatypes voor opslagmedia

• definities van ruimtelijke functies en ruimtelijke filters

• algemene (d.w.z. niet applicatiespecifieke of domeinspecifieke) API’s.

We moeten er voor waken dat de nieuwe ontwikkelingen niet zorgen voor een nieuwe extra

standaard. In plaats daarvan moeten we een structuur bedenken die aansluit op de bestaande

standaarden. Deze moeten zowel in het corpus van het OGC (of ISO/TC211) als in het webdomein te

vinden zijn.

De nieuwe universele standaard is nu in ontwikkeling. Dit WebProtégé-project kan worden bekeken

om een idee te krijgen van die ontwikkeling. Een fascinerende eigenschap is dat er maar twee

kernbegrippen (of klassen) nodig lijken te zijn voor een multifunctioneel model voor ruimtelijkheid.

Die twee begrippen zijn de concepten voor een ruimtelijk ding en een geometrie.

Ruimtelijk ding Een ruimtelijk ding kan worden gedefinieerd als iets dat een zekere aanwezigheid of omvang heeft

in de ruimte. Die ruimte kan één, twee of drie dimensies hebben en kan echt of virtueel zijn.

Voorbeelden van ruimtelijke dingen zijn de planeet Saturnus, de ruimtesonde Voyager 2, de

Eiffeltoren, een tekening op een vel papier, het aardmagnetisch veld, een amoebe, het verloren

eiland Atlantis en jij. Uiteindelijk is het degene die over data wil beschikken, die besluit of het zinnig

is iets als een ruimtelijk ding te zien.

Een belangrijke eigenschap van ruimtelijke dingen is dat ze onderling relaties aan kunnen gaan.

Verschillende soorten van ruimtelijke relaties kunnen worden onderscheiden. Bijvoorbeeld

Page 16: Ruimtelijke data op het web - Geodan...Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt Ze zijn een onmisbaar ingrediënt in concepten

16

topologische relaties. Bij deze soort kan ruimtelijk ding A ruimtelijk ding B omsluiten, of zich naast

ruimtelijk ding C bevinden. Afstandsrelaties zijn een andere soort: een ruimtelijk ding kan zich op

524 meter van een ander ruimtelijk ding bevinden, of, wat vager, het kan ver weg van zijn van het

volgende ruimtelijke ding. Tenslotte zijn er nog richtingsrelaties. Zo kan ruimtelijk ding A ten

noorden van ruimtelijk ding B zijn, of een verdieping boven ruimtelijk ding C. Het is goed voor te

stellen dat de mogelijkheid ruimtelijke relaties op een algemene manier uit te drukken zeer

voordelig kan zijn voor verbondenheid van data op het web.

Een ruimtelijk ding kan worden geïdentificeerd door een code, bijvoorbeeld een toponiem of een

adres. Ook kan het worden beschreven door één of meer geometrieën, en daarmee is het tweede

kernbegrip genoemd.