Post on 21-Jun-2020
1
- whitepaper -
Ruimtelijke data op het web
INHOUDSOPGAVE
2 Moeten we ruimtelijke data delen op het web?
6 Wat doet werkgroep OGC/ W3C?
10 Ruimtelijke data op het web; hoe zou het moeten werken?
13 Ruimte maken voor ruimtelijke data op het web
2
Moeten we ruimtelijke data delen op
het web?
Ruimtelijke data op het web bieden ongekende mogelijkheden. Ze zijn een onmisbaar ingrediënt
in concepten als Big Data, het Internet of Things, Machine Learning en de slimme leefomgevingen.
Maar om ze echt goed toe te passen, moet er nog wel wat gebeuren. Daarvoor is in 2014 de
Spatial Data on the Web Working Group (SDDWG) in het leven geroepen.
Frans Knibbe (Geodan Research) staat stil bij de waarde van het delen van ruimtelijke data op het
web. Daarnaast laat hij de noodzaak van samenwerking zien binnen de domeinen ruimtelijke data
en het web.
Wat is het web precies? In het alledaagse taalgebruik zijn het internet en het wereldwijde web (www) vaak uitwisselbare
begrippen. Toch zitten er wel degelijk verschillen in. Geboren uit een voorloper uit 1969 werd het
internet zoals we dat nu kennen in 1983 een feit. De basis van het internet is TCP/I P, een standaard
voor communicatie tussen computers. Het bestaan van het internet maakte het ontstaan van het
wereldwijde web (www of kortweg ‘het web’) mogelijk.
Het web is begonnen in 1991 en werd uitgevonden door Tim Berners-Lee, tegenwoordig directeur
van het World Wide Web Consortium (W3C). Het web kan niet bestaan zonder het internet; het is
een van de toepassingen die op het internet draaien (e-mail is een voorbeeld van een andere
toepassing). Ook het web is gebaseerd op standaarden. De belangrijkste zijn HTTP, een protocol
voor het uitwisselen van hypertext (tekst met hyperlinks, zoals dit blog), HTML, een
standaardformaat voor de opmaak van hypertext en de URL of URI (een universele identificatie van
resources).
De totstandkoming van het web maakte het mogelijk om op een universele wijze tekstdocumenten
te publiceren en te koppelen. Later werd naast tekst ook (stil of bewegend) beeld gedeeld via
webstandaarden en tegenwoordig kunnen webbrowsers zo veel dat ze als volwaardige
besturingssystemen (zoals Windows of Linux) kunnen worden beschouwd. Dat het web een enorme
invloed heeft gehad op de wereld is zacht uitgedrukt. Wereldwijde communicatie is drastisch
veranderd en op sociaal, economisch, cultureel en politiek gebied is de wereld door het web radicaal
veranderd. Ook het web zelf verandert mee.
3
Er is een groeiende tendens om het web te gebruiken voor het delen van ruwe data. Ruwe data zijn
een bron van informatie en kennis. Ze liggen ten grondslag aan vele beslissingen die worden
gemaakt door bedrijven, overheden en burgers.
"Het web kan niet bestaan zonder het
internet; het is een van de toepassingen
die op het internet draaien"
Frans Knibbe
Ruimtelijke data: meer dan geo-data Data die iets zeggen over locatie zijn ruimtelijke data. En dat omvat meer dan alleen de geografische
data die traditioneel worden opgeslagen en gebruikt via Geografische Informatiesystemen (GIS). Om
te beginnen is het goed om te beseffen dat de aanduiding ‘ruimtelijk’ algemener is dan
‘geografisch’. Geografische data gebruiken de aarde, of een model van de aarde, als referentie.
Gegevens over locaties op andere hemellichamen zijn dus wel ruimtelijk, maar niet geografisch. Ook
gegevens over locaties die zich wel op aarde bevinden, maar geen aan de aarde gerelateerd
coördinaatsysteem gebruiken, zijn wel ruimtelijk maar niet geografisch.
Neem bijvoorbeeld een 3D-model van een gebouw. Vaak wordt een coördinaatsysteem gebruikt dat
niet direct aan de aarde te relateren is. Een andere vorm van ruimtelijke data werd genoemd in één
van de use cases voor de SDWWG: het beschrijven van vormen en ruimtelijke relaties in
microscoopplaatjes, ten behoeve van kankeronderzoek. Ruimtelijke data zijn dus niet beperkt tot de
menselijke schaal.
Verder is het goed te beseffen dat ruimtelijke data niet alleen in getallen (coördinaten) zijn uit te
drukken. Er bestaan ook andere manieren om locaties aan te duiden: bijvoorbeeld via namen
(toponiemen) of adressen.
Ten slotte bestaan er gegevens over locaties waarvan de locatie onbekend of vaag is. Als u iets weet
over geschiedenis, of ‘Asterix en het ijzeren schild’ heeft gelezen, zal de plaatsnaam Alesia u
4
misschien bekend in de oren klinken. Het is een historische locatie, maar waar het precies was, daar
is men het nog niet over eens.
Een andere vorm van vaagheid treedt op bij hedendaagse begrippen als ‘het Midden-Oosten’, ‘de
Sahara’ of ‘de Randstad’: een goede definitie van de grens is niet te geven. Toch zijn het ruimtelijke
objecten. Of wat dacht u van ‘aan de overkant van de straat’ of ‘in mijn linkerbroekzak’? Allemaal
plaatsbepalingen. De laatste twee voorbeelden geven ook aan dat ruimtelijke gegevens meer
omvatten dan locaties vastleggen. Ook relaties tussen locaties zijn van belang en kunnen als data
worden vastgelegd of afgeleid uit locatiebepalingen. Voorbeelden hiervan zijn: ‘België grenst aan
Nederland’ of ‘Ik bevind mij op twintig kilometer van het dichtstbijzijnde tankstation’.
Holistische benadering werpt vruchten af Historisch gezien speelden ontwikkelingen in ruimtelijke data en webdata zich in aparte domeinen
af. Gelukkig is er tegenwoordig een trend van wederzijdse toenadering. Neem bijvoorbeeld de
toenemende populariteit van specificaties als GeoJSON (vectorgeometrie in JavaScript Object
Notation) en TopoJSON (een extensie op GeoJSON die geometrie topologisch opslaat). Of de steeds
verdergaande ontwikkeling van wat Google met geografische data doet. Toch spelen nog veel
ontwikkelingen binnen de aparte domeinen af. En dat is jammer, want door problemen zo holistisch
mogelijk te benaderen, boeken we de beste duurzame vooruitgang.
Vanuit een historisch GIS-perspectief is er een wens van schaalvergroting en van
interoperabiliteitsverhoging (het beter uitwisselen van gegevens van diverse digitale systemen). De
eerste generatie GIS kenmerkte zich door dataopslag in bestanden en formaten die verschillen per
GIS-pakket. De interoperabiliteit was laag; om gegevens van één pakket in het andere te gebruiken,
moest je de gegevens converteren, met alle rompslomp en risico’s van dien. Bij de tweede generatie
GIS kon je geografische gegevens opslaan in meer algemene relationele databases. Zodoende kon je
grotere datahoeveelheden gebruiken. Ondertussen konden meerdere soorten software de gegevens
gebruiken en kon je geografische data beter combineren met andersoortige data. En nu zijn we toe
aan een derde generatie GIS, waarbij alle data, ruimtelijk en niet-ruimtelijk, via één grote
wereldwijde gedistribueerde database worden gedeeld. Hier zal de meeste gebruikersinteractie via
webapplicaties plaatsvinden. Weer een grote stap vooruit op het gebied van schaal en
interoperabiliteit.
Kennis hard nodig Vanuit een historisch webperspectief is het toenemende belang van ruwe data te zien. Het web
ontwikkelt zich van een platform om documenten te delen tot een alomvattend IT-systeem. En
daarbij hoort een manier om ruwe data op te slaan, delen, combineren en ondervragen. Bij die
ontwikkeling is de kennis over ruimtelijke data die de laatste decennia in de GIS-wereld is
5
opgebouwd onontbeerlijk. Om goed om te kunnen gaan met complexe objecten,
coördinaatsystemen, ruimtelijke relaties, ruimtelijke netwerken en dergelijke, is de kennis die
binnen organisaties als het OGC is opgebouwd hard nodig. Deze zal moeten worden uitgebuit.
SDDWG Samenvattend is het van groot belang dat ruimtelijke data goed op het web kunnen werken. Om dat
te realiseren is de Spatial Data on the Web Working Group (SDDWG) in het leven geroepen, een
gezamenlijk initiatief van het OGC en het W3C.
6
Wat doet werkgroep OGC/ W3C?
Om het vrij delen van ruimtelijke data op het web mogelijk te maken, hebben het Open
Geospatial Consortium (OGC) en het Word Wide Web Consortium (W3C) in 2014 gezamenlijk een
werkgroep opgericht. Die werkgroep heeft als doel de standaarden te verbeteren en te
verduidelijken. En dat is hard nodig, weet Frans Knibbe van Geodan Research.
In een eerder blog schreef ik over de aard van ruimtelijke data, het belang van ruimtelijke data op
het web en het gegeven dat geo-informatie in een overgangsfase zit. Data hoeven niet langer in
afgesloten silo’s te zitten, maar kunnen vrij worden gedeeld. Het OGC en het W3C, belangrijke
organisaties voor respectievelijk geo-informatie en het wereldwijde web, snappen dat die overgang
in goede banen moet worden geleid. Vandaar de oprichting van een gezamenlijke werkgroep, de
Spatial Data on the Web Working Group (SDWWG). Dat was een unieke gebeurtenis: nooit eerder
werkten de OGC en W3C op die manier samen. Het was dan ook even zoeken naar een geschikte
vorm die paste bij beide organisaties, maar het is gelukt.
De missie Het formele document waarmee de doelen van de werkgroep zijn vastgelegd, is het handvest.
Daarin worden de missie en de op te leveren resultaten beschreven. In deze blog wil ik ingaan op die
doelstellingen. De SDWWG zet zich in voor het verbeteren en verduidelijken van standaarden voor
het omgaan met ruimtelijke data op het web. En dat is hard nodig, want het huidige aanbod van
standaarden is tamelijk onoverzichtelijk. Op sommige gebieden zijn er teveel standaarden,
bijvoorbeeld over hoe een vectorgeometrie (een geordende verzameling coördinaten) gecodeerd
kan worden. Op andere gebieden is er juist een tekort aan standaardisatie. Hoe naar een
coördinaatsysteem verwezen kan worden, is bijvoorbeeld niet duidelijk. Deze wanorde kan deels
verklaard worden door de alomtegenwoordigheid van ruimtelijke data. Het overgrote deel van data
die we op het web willen gebruiken, hebben ruimtelijke aspecten. Dat betekent dat iedereen die
iets met data wil doen ook iets met dat ruimtelijke aspect zou moeten doen. Velen hebben zich dus
al met standaardisatie van ruimtelijke data beziggehouden, vanuit een eigen domeinperspectief en
soms al voordat het web in beeld kwam als platform voor het uitwisselen van data.
Zo heeft het OGC voor geo-informatie-experts een uitgebreide verzameling aan standaarden, die
samen een complex en gesloten semantisch systeem vormen. Ook in andere domeinen heeft men
standaarden voor locatie ontwikkeld, om bijvoorbeeld een toponiem, een adres, of een puntlocatie
uit te drukken. Het web is echter een omgeving waar alle domeinen bij elkaar kunnen komen.
7
Wat levert de werkgroep op? In het handvest staat beschreven wat de werkgroep van plan is op te leveren:
• Een document met gebruiksscenario’s en vereisten (use cases and
requirements);
• Een overzicht van best practices voor terbeschikkingstelling en consumptie van
ruimtelijke data op het web;
• Een verbeterde versie van de Time Ontology in OWL (een ontologie voor het
uitdrukken van gegevens over tijd);
• Een verbeterde versie van het Semantic Sensor Network Vocabulary;
• Een voorziening (vermoedelijk een ontologie) om coveragedata via het web te
delen;
Zowel het OGC als het W3C publiceren de resultaten, waarbij de laatste drie uit bovenstaand rijtje
een formelere status zullen hebben dan de eerste twee. Over elk van deze op te leveren resultaten
is wel iets interessants te melden.
Gebruiksscenario's en vereisten vormen fundament De gebruiksscenario’s en daaruit af te leiden vereisten zijn de basis voor het verdere werk. Daarom
heeft de werkgroep deze als eerste aangepakt en gepubliceerd. Zie hier de laatst gepubliceerde
versie. Dit document bevat beschrijvingen van verschillende soorten gebruik van ruimtelijke data op
het web. Daaruit is af te leiden wat er nodig is om het goed te laten werken. Een paar belangrijke
vereisten zijn:
• Eenduidige standaarden voor het vastleggen van ruimtelijke gegevens,
ruimtelijke relaties en ruimtelijke metadata;
• Het koppelbaar maken van ruimtelijke gegevens;
• Het vindbaar en doorzoekbaar maken van ruimtelijke gegevens op het web.
Best practices inventariseren De werkgroep is inmiddels best practices aan het verzamelen die een tweede document gaan
vormen. Hierin komt te staan hoe ruimtelijke data het beste op het web gepubliceerd, gevonden en
geconsumeerd kunnen worden. Dit op een laagdrempelige wijze, het is namelijk ook bestemd voor
mensen die af en toe, of zijdelings met ruimtelijke data te maken hebben. De werkgroep zoekt
daarbij uit in hoeverre de huidige praktijk van data op het web (o.a. gebruik van JSON en simpele,
8
RESTvolle APIs) toepasbaar is op ruimtelijke data. Hiervoor inventariseert de werkgroep welke
standaarden en hulpmiddelen er nu zijn en hoe ruimtelijke data op het web nu worden
gepubliceerd. Bij overlap zal de werkgroep keuzes maken. Bij functionele gaten – sommige dingen
zijn nog op geen enkele manier goed te doen – zal de werkgroep zelf een oplossing zoeken,
bijvoorbeeld in de vorm van samenwerking met andere gemeenschappen om een bepaalde
websemantiek uit te breiden.
Temporele data Op het eerste gezicht lijkt het vreemd dat een werkgroep over ruimtelijke data zich ook met tijd
bezig houdt. Op niet-kosmisch niveau zijn ruimte en tijd immers eigenschappen die niet per se
samengaan: data kunnen tijdaspecten hebben, ruimtelijke aspecten, of beide. Toch zijn er redenen
te bedenken:
1. Standaarden voor publicatie van ruimtelijke data voldoen nu vaak niet voor
serieuze, professionele toepassingen van data door overheden of
onderzoeksinstituten. Die data hebben vaak ook een tijdaspect, bijvoorbeeld
doordat de dingen die worden beschreven veranderlijk zijn.
2. Ruimtelijke data delen is belangrijk in wetenschappen als geschiedenis,
archeologie en geologie. Eén van de verbeterpunten van de tijdontologie is
ondersteuning voor tijd die niet via de gregoriaanse kalender of ISO 8601 kan
worden uitgedrukt. Juist in historische wetenschappen zijn dat soort
uitdrukkingen nodig.
3. Het OGC heeft het concept tijd al gemodelleerd in diverse standaarden,
bijvoorbeeld voor tijdreeksen, die worden gezien als een soort coverage – een
type ruimtelijke data.
4. Er zit veel logische overlap tussen ruimte en tijd, hetgeen blijkt als bijvoorbeeld
de intervalalgebra van Allen wordt vergeleken met de DE-9IM. Overeenkomsten
in tijd en eendimensionale ruimte als in linear referencing zijn zo mogelijk nog
groter.
5. Vanwege onze onrustige aardkorst, waarbij platen continu bewegen, zijn
coördinaatsystemen voor geografie tijdsafhankelijk.
Semantisch Sensornetwerk verbeteren Sensoren hebben twee ruimtelijke aspecten. Ten eerste hebben ze een locatie, die vast of variabel
kan zijn, en ten tweede meten ze vaak een ruimtelijk fenomeen, zoals luchtvervuiling of de locatie
van personen in een ruimte. Standaarden voor sensordata worden dan ook uitgewerkt binnen het
OGC. En sinds 2011 is er een bruikbare standaard voor het Semantisch Web, het Semantic Sensor
9
Network (SSN). Die standaard lijkt voor verbetering vatbaar: meer mogelijkheden en makkelijker te
gebruiken. Het resultaat zal moeten bijdragen aan een algemenere beschikbaarheid,
interoperabiliteit en bruikbaarheid van sensordata op het web. En dat biedt mogelijkheden voor
bijvoorbeeld het Internet of Things (of Web of Things) en het slimmer maken van onze
leefomgevingen.
"Het web zal dan, meer nog dan nu al
het geval is, dé plek worden om
gegevens te delen"
Frans Knibbe
Coveragedata op het web Coverage is een belangrijke vorm van ruimtelijke data die we laagdrempelig op het web moeten
kunnen delen. Een coverage is een verzameling data die een ruimte- en/of tijdvariabel fenomeen
beschrijven. Een coverage kan één tot vier dimensies bestrijken. Voorbeelden van coveragedata zijn
satellietbeelden, tomogrammen, tijdreeksen en puntenwolken. Het is een klasse van data die erg
belangrijk is voor onderzoek. Bijvoorbeeld het onderzoek naar milieu en klimaat. Het resultaat van
de werkzaamheden zal waarschijnlijk een formele ontologie voor coveragedata op het Web zijn, zo
veel mogelijk gebaseerd op bestaande en nog te ontwikkelen specificaties van het OGC, en wellicht
op het Data Cube Vocabulary voor multidimensionale data.
Ambitieus. Té Ambitieus? De doelstellingen zijn zeer ambitieus. Mocht de werkgroep ze halen, dan zal het web, nog meer dan
nu al het geval is, dé plek worden om gegevens te delen. Evengoed zullen de standaarden en best
practices goed inzetbaar zijn op intranetten om problemen met niet-deelbare data en slecht
gekoppelde systemen binnen organisaties te verhelpen. Maar zijn de doelstellingen te halen? De
groep heeft weliswaar zeventig experts in spatiotemporele data en/of webdata, maar het
merendeel doet mee als vrijwilliger en sommige problemen zijn erg lastig. De tijd zal het leren, maar
er is zeker hoop op bruikbare resultaten rond het einde van 2016.
Daarom gaat de werkgroep pragmatisch te werk door gebruik te maken van bestaande standaarden
en specificaties, en door samen te werken met andere gemeenschappen. Bovendien is het web een
10
platform dat bestaat uit vele modules die slim met elkaar gecombineerd weer nieuwe dingen
opleveren. Mocht de werkgroep er niet in slagen alle doelstellingen en vereisten te realiseren, dan
zal het werk op zijn minst bouwstenen voortbrengen waarmee verder gebouwd kan worden.
11
Ruimtelijke data op het web; hoe zou
het moeten werken?
Wat moet er gebeuren voordat ruimtelijke data zich als voorbeeldige en nuttige webbewoners
kunnen gedragen? Welke afspraken moeten we maken om de talrijke mogelijkheden van
ruimtelijke data op het web binnen handbereik te krijgen? Frans Knibbe, Geodan Research, gaat in
op het eisenpakket dat is samengesteld door de Spatial Data on the Web Working Group
(SDWWG), een gezamenlijk initiatief van het OGC en het W3C.
Dit is het derde blog van een serie over ruimtelijke data op het web. In het eerste deel beschreef ik
de waarde van het delen van ruimtelijke data op het web en de noodzaak van synthese van
domeinstandaarden om dat goed te doen. Iets dat de SDWWG moet verzorgen. In het tweede deel
beschrijf ik wat de SDWWG wil bereiken. In dit artikel behandel ik het eerste resultaat van deze
werkgroep, het overzicht van gebruiksscenario’s en de vereisten.
Use cases and requirements Het is een beproefde methode om te bepalen hoe een systeem tot stand moet komen: je verzamelt
verhalen van gebruikers die beschrijven hoe iets goed zou kunnen werken, of wat er nu níet goed
werkt. Uit die verhalen zijn systeemeisen af te leiden; afvinkbare en testbare eigenschappen van
hetgeen gemaakt moet worden. Deze methode is ook toegepast in de SDWWG. Eén van hun
deliverables, beschreven in het vorige blog, is een overzicht van gebruiksscenario’s en eisen. De
tweede publieke conceptversie hiervan is net gepubliceerd. Het bevat de basis voor de overige vier
resultaten:
• Best Practices
• Time Ontology
• Semantic Sensor Network Vocabulary
• Coverage in Linked Data
Het document bevat zo’n vijftig verschillende gebruikersscenario’s (use cases), en bijna zestig
vereisten (requirements) die daaruit volgen. Vooral de vereisten voor de Best Practices zijn
interessant, want die aanbevelingen zouden het antwoord moeten geven op de algemene vraag:
hoe kunnen we ruimtelijke data op het web het best publiceren en gebruiken? Een aantal
onderdelen van de vereisten sprong eruit:
12
• Vindbaarheid
• Koppelbaarheid van data
• Onzekerheid
• Ruimtelijke relaties
• Metadata
• Coördinatenstelsels
Vindbaarheid Wat heb je aan data die wel ergens op het web staan maar die je niet kunt vinden? Niet veel.
Vindbaarheid is een logische eis die we aan ruimtelijke data op het web stellen. Een traditionele
manier om ruimtelijke data kenbaar te maken op het web is het publiceren van metadata in een
datacatalogus, bijvoorbeeld via de CSW-specificatie. Maar deze manier is niet optimaal. Als er iets
op het web wordt gezocht, maken we meestal gebruik van een zoekmachine, zoals Google. Het
indexeerbaar maken voor zoekmachines is daarom cruciaal. Een zoekmachine maakt gebruik van
een zogeheten crawler: een algoritme dat recursief hyperlinks volgt. Alles dat de crawler vindt, kan
geïndexeerd worden en is daarmee vindbaar. Voor een goede vindbaarheid van data moeten dus
niet alleen metadata worden gepubliceerd die de data goed beschrijven (het liefst op een algemene
webmanier), maar de data moeten onderling ook zodanig gekoppeld zijn dat een crawler zoveel
mogelijk kan vinden. Daarnaast helpt het wanneer data kunnen worden opgevraagd in een formaat
dat webcrawlers begrijpen, zoals HTML.
Koppelbaarheid Het heeft veel met vindbaarheid van data te maken: de mogelijkheden om data te koppelen en
verbanden te leggen tussen elementen binnen of tussen verschillende datasets. Het zijn
koppelingen (hyperlinks) die de draadjes van het web vormen. Ze vormen een essentieel onderdeel
van het web. Hoe beter iets gekoppeld is of gekoppeld kan worden, hoe nuttiger het is. Koppelingen
op het web kunnen tot stand gebracht worden via HTTP(S) URI’s. Als iets een URI heeft kan iets
anders ermee koppelen. Tegelijkertijd is er een manier om de achterliggende data op te vragen.
Namelijk via HTTP. Waarschijnlijk zal in de Best Practices worden aangeraden om aan ruimtelijke
data HTTP(S) URI’s toe te kennen. Dat geeft de mogelijkheid direct en expliciet data aan elkaar te
koppelen. Maar ook impliciete koppelingen kunnen waardevol zijn. Door op het web van
gemeenschappelijke datadefinities gebruik te maken, kunnen semantische koppelingen worden
gemaakt. Wanneer bijvoorbeeld in twee aparte datasets gebruikgemaakt wordt van een algemene
definitie van een administratief gebied (zoals https://schema.org/AdministrativeArea), is er een
verband tussen die datasets gemaakt.
13
Onzekerheid Zowel bij ruimtelijke als temporele aspecten van data komt onzekerheid voor. Het kan verschillende
vormen hebben. Bij vectorgeometrie is het bijvoorbeeld de nauwkeurigheid van de getallen die die
coördinaten vormen. Tekstuele aanduidingen kunnen ook vaag of ambigu zijn. Neem de plaatsnaam
‘Bergen’. Er zijn alleen al in Nederland meerdere woonplaatsen die zo heten. En de ruimtelijke
eigenschappen van zo’n plaats veranderen ook nog eens met de tijd, dus zonder tijdsaanduiding zijn
namen van locaties hoe dan ook niet eenduidig tot ruimtelijke eigenschappen te herleiden.
Daarnaast hebben sommige plaatsen, zoals de Sahara, helemaal geen duidelijke ruimtelijke
afbakening. En wat te denken van aanduidingen van ruimtelijke relaties als ‘in de buurt van’ of
‘beneden de grote rivieren’? Wat we in ieder geval niet willen is dat data níet gedeeld worden
vanwege onzekerheid, of dat informatie over onzekerheid niet wordt gedeeld. Simpelweg omdat
het niet duidelijk is hoe onzekerheid aangegeven kan worden. Gegevens zullen altijd onzekerheden
hebben, maar dat betekent geenszins dat ze niet waardevol kunnen zijn. Het is dus belangrijk om
ruimtelijke en temporele onzekerheid goed uit te kunnen drukken wanneer data op het web worden
gepubliceerd.
14
Ruimte maken voor ruimtelijke data op
het web
In de ideale wereld worden ruimtelijke data overal soepel gedeeld op het wereldwijde web.
Helaas is dit vooralsnog toekomstmuziek. Er is geen overeenstemming over de werkwijze van
ruimtelijke data op het web. En dat is wel nodig. In dit blog verkent Frans Knibbe, Geodan
Research, het potentieel van een nieuwe universele webstructuur voor ruimtelijke data.
Onlangs had ik het voorrecht mee te kunnen doen in discussies over hoe het web een betere plek
voor data kan worden, tijdens de jaarlijkse W3C-conferentie TPAC. Een nobel doel, want het delen
van allerlei soorten data kan de mensheid de kennis en wijsheid geven die het zo hard nodig heeft.
Voor het delen van ruwe data zijn al goede methoden gevonden. Zo zijn ze tegenwoordig een stuk
makkelijker te vinden, begrijpen, verwerken en combineren. Recente bewijzen hiervan zijn
bijvoorbeeld de Data on the Web Best Practices en een conceptaanbeveling van het W3C. Daarnaast
kwam Google met een handleiding over hoe wetenschappelijke datasets voorzien kunnen worden
van een geschikte context met termen uit schema.org om vindbaarheid te verhogen. Voor
ruimtelijke data in het bijzonder is de Spatial Data on the Web Working Group (SDWWG), waaraan
ook Geodan meedoet, bezig de algemene richtlijnen Data on the Web Best Practices uit te breiden
tot Best Practices for Spatial Data on the Web.
Ruimtelijke data Er is iets bijzonders aan de hand met ruimtelijke data op het web. Zou je de beste methodiek willen
selecteren, dan is er geen tekort aan praktijken om te evalueren. Kijk alleen maar naar de vele
manieren waarop geografische data (ruimtelijke data met een relatie tot het aardoppervlak) kunnen
worden gedeeld op het web. En het gaat verder, want ruimtelijke data zijn niet het exclusieve
domein van geografen. Aspecten van ruimtelijkheid zijn in vrijwel alle gebieden van menselijk
handelen aan te treffen. Zodoende zijn er vele domeingebonden manieren ontwikkeld om
ruimtelijke data uit te drukken. Alles bij elkaar is er een enorme hoeveelheid aan standaarden en
praktijken.
Ruimtelijke data zijn overal. Het zou zonde zijn als al die nuttige data in hun eigen donkere hoekjes
van het web blijven, zonder de mogelijkheid ze te combineren. Ruimte is, net als tijd, een universeel
fenomeen en hebben daardoor de potentie elkaar perfect aan te vullen. Als het zou lukken om al die
diverse gegevens op één lijn te krijgen, dan zou dat een ‘dataversum’ opleveren waaraan de
15
stoutmoedige ruimteverkenner het hart kan ophalen. Helaas is ruimte echter nog geen goed
navigeerbare dimensie in het dataweb.
Een structuur voor ruimtelijkheid Wat er nodig lijkt te zijn is een universeel model van ruimtelijkheid. Iets dat simpel en krachtig is, en
klaar voor het web. Iets dat iedereen snel kan inzetten zonder al te veel aanpassingen aan
bestaande praktijken. In het handvest noemen we het ontwikkelen van een algemene ruimtelijke
structuur als doel. Daarom is de SDWWG begonnen met het ontwikkelen van een standaard
werkwijze voor ruimtelijke data op het web. Het idee is dat het een nieuwe versie van de huidige
ontologie van GeoSPARQL zal zijn. De nieuwe structuur zal verder uitgewerkte definities moeten
bevatten van de kernbegrippen voor ruimtelijke data. Zulke definities kunnen dan het fundament
zijn voor bijvoorbeeld:
• data-uitwisselingsformaten
• datatypes voor opslagmedia
• definities van ruimtelijke functies en ruimtelijke filters
• algemene (d.w.z. niet applicatiespecifieke of domeinspecifieke) API’s.
We moeten er voor waken dat de nieuwe ontwikkelingen niet zorgen voor een nieuwe extra
standaard. In plaats daarvan moeten we een structuur bedenken die aansluit op de bestaande
standaarden. Deze moeten zowel in het corpus van het OGC (of ISO/TC211) als in het webdomein te
vinden zijn.
De nieuwe universele standaard is nu in ontwikkeling. Dit WebProtégé-project kan worden bekeken
om een idee te krijgen van die ontwikkeling. Een fascinerende eigenschap is dat er maar twee
kernbegrippen (of klassen) nodig lijken te zijn voor een multifunctioneel model voor ruimtelijkheid.
Die twee begrippen zijn de concepten voor een ruimtelijk ding en een geometrie.
Ruimtelijk ding Een ruimtelijk ding kan worden gedefinieerd als iets dat een zekere aanwezigheid of omvang heeft
in de ruimte. Die ruimte kan één, twee of drie dimensies hebben en kan echt of virtueel zijn.
Voorbeelden van ruimtelijke dingen zijn de planeet Saturnus, de ruimtesonde Voyager 2, de
Eiffeltoren, een tekening op een vel papier, het aardmagnetisch veld, een amoebe, het verloren
eiland Atlantis en jij. Uiteindelijk is het degene die over data wil beschikken, die besluit of het zinnig
is iets als een ruimtelijk ding te zien.
Een belangrijke eigenschap van ruimtelijke dingen is dat ze onderling relaties aan kunnen gaan.
Verschillende soorten van ruimtelijke relaties kunnen worden onderscheiden. Bijvoorbeeld
16
topologische relaties. Bij deze soort kan ruimtelijk ding A ruimtelijk ding B omsluiten, of zich naast
ruimtelijk ding C bevinden. Afstandsrelaties zijn een andere soort: een ruimtelijk ding kan zich op
524 meter van een ander ruimtelijk ding bevinden, of, wat vager, het kan ver weg van zijn van het
volgende ruimtelijke ding. Tenslotte zijn er nog richtingsrelaties. Zo kan ruimtelijk ding A ten
noorden van ruimtelijk ding B zijn, of een verdieping boven ruimtelijk ding C. Het is goed voor te
stellen dat de mogelijkheid ruimtelijke relaties op een algemene manier uit te drukken zeer
voordelig kan zijn voor verbondenheid van data op het web.
Een ruimtelijk ding kan worden geïdentificeerd door een code, bijvoorbeeld een toponiem of een
adres. Ook kan het worden beschreven door één of meer geometrieën, en daarmee is het tweede
kernbegrip genoemd.