Samenvatting

In deze White paper kijken we terug op 10 jaar standaarden ontwikkelen en beheren. Hierbij richten we ons specifiek op de set Geostandaarden van de Pas toe of leg uit-lijst van het Forum Standaardisatie. Deze set vormt de ruggengraat van de Nederlandse spatial data infrastructure (SDI). Op basis van trends en technologische ontwikkelingen proberen we 5 jaar vooruit te kijken en de vraag te beantwoorden of de huidige set standaarden nog volledig voldoet. In hoeverre zijn innovaties en ontwikkelingen zo volwassen geworden, dat ze weerslag hebben op de standaarden die we nu beheren?

Status van dit document

Deze paragraaf beschrijft de status van dit document ten tijde van publicatie. Het is mogelijk dat er actuelere versies van dit document bestaan. Een lijst van Geonovum publicaties en de laatste gepubliceerde versie van dit document zijn te vinden op http://www.geonovum.nl/wegwijzer/standaarden

Dit is een document zonder officiële status.

Noot

Tijdens de consultatie vragen we reacties op deze hele white paper, maar op een aantal punten zijn we expliciet op zoek naar de mening van het werkveld. Deze punten zijn als Issue gemarkeerd in deze white paper.

1. Inleiding

Terugkijkend op tien jaar standaarden ontwikkelen en beheren, kunnen we vaststellen dat we in Nederland inmiddels een volwassen set standaarden kennen, die fungeert als de ruggengraat van de nationale spatial data infrastructure (SDI). Deze set standaarden is opgenomen op de Pas toe of leg uit-lijst van het Forum Standaardisatie. Geonovum beheert -als hoeder van deze ruggengraat- deze set en is van de meeste afzonderlijke standaarden ook de beheerder. De set geostandaarden bevat het Basismodel Geo-informatie (NEN3610), het 'moedermodel' van veel informatiemodellen waarmee semantiek van datasets éénduidig wordt vastgelegd, en een aantal standaarden die vastleggen hoe we deze datasets kunnen uitwisselen (GML), ontsluiten (Nederlandse profielen op WMS en WFS) en vindbaar maken (Nederlandse metadataprofielen).

Hoewel de huidige SDI met de INSPIRE richtlijn, de datasets van geo-basisregistraties, en voorzieningen als PDOK niet meer weg te denken is uit de dagelijkse praktijk van het geo-informatiewerkveld, is een SDI nooit uitontwikkeld. Technologische ontwikkelingen volgen elkaar in hoog tempo op en de maatschappelijke vragen evolueren. Waar de SDI oorspronkelijk alleen op de geo-professional gericht was, verwachten we tegenwoordig dat de SDI toegankelijk wordt voor een veel bredere gebruikersgroep, waaronder de web-ontwikkelaars. Deze beoogde verbreding komt voort uit de toegenomen aandacht voor (her)bruikbaarheid van data, waar oorspronkelijk de focus meer lag op de ontsluiting zelf. Deze verschoven focus zien we nu ook onder de noemer 'van open data naar FAIR data', een concept oorspronkelijk bedacht voor wetenschappelijke (onderzoeks)data. Essentie hiervan: data dient niet alleen open te zijn, maar ook vindbaar, toegankelijk, interoperabel en herbruikbaar.

In de toekomst verwachten we meer samenhang (en consistentie) tussen individuele datasets, meer detail in datasets (overgang van 2D naar 3D) en vormen van toegang tot data die aansluiten bij de gebruikerswensen van de veel bredere gebruikersgroep van de Nederlandse SDI.

De Nederlandse SDI kan alleen succesvol meegaan in deze ontwikkeling, wanneer de onderliggende set standaarden dit afdoende ondersteunt. Daarom stellen we ons in deze white paper de vraag of de huidige set standaarden nog volledig voldoet. In hoeverre zijn innovaties en ontwikkelingen zo volwassen geworden, dat ze weerslag hebben op de standaarden die we nu beheren? Langs de lijn van de geostandaarden die op de Pas toe leg uit-lijst staan, schetsen we welke updates van deze standaarden er de komende 5 jaar mogelijk gaan komen. Input hiervoor komt uit ontwikkelingen die Geonovum de afgelopen jaren heeft verkend en gevolgd in de innovatieplatforms rond 3D, Linked Data, Sensoren en het Web en in internationale context. Op sommige punten kunnen we al aanbevelingen geven, op andere zijn er nog open vragen.

1.1 Scope

De scope van deze white paper beperkt zich tot de set geostandaarden die op de Pas toe of leg uit-lijst staat van het Forum Standaardisatie. Deze standaarden vormen gezamenlijk de ruggengraat van de Nederlandse SDI. Door vooruit te kijken naar de ontwikkelingen rond deze set standaarden, schetsen we hiermee automatisch de toekomstige ontwikkelingen van de Nederlandse SDI. Het is overigens goed denkbaar dat over vijf jaar de Nederlandse SDI minder herkenbaar is als afzonderlijke infrastructuur, maar eerder gezien kan worden als de ruimtelijke component van de generieke digitale infrastructuur.

Issue 4: Scope issue

2.1 Meer 3D geo-informatie

Hoewel de steeds realistischer ogende visualisaties, inclusief tools als de Oculus Rift VR bril en de Hololens AR bril tot de verbeelding spreken, schuilt in de opkomst van deze gadgets niet de reden dat SDI's steeds meer richting 3D gaan. De stap van 2D naar 3D is ook de stap van een grover naar een gedetailleerder model. En die gedetailleerdere modellen zijn steeds harder nodig, omdat de maatschappij steeds gedetailleerdere ruimtelijke vragen stelt, bijvoorbeeld over de fysieke leefomgeving en de kwaliteit daarvan. “Hoeveel geluidsbelasting ondervind ik na realisatie van die nieuwe weg?”, “Zit ik straks met een slagschaduw in mijn tuin, wanneer die windmolen daadwerkelijk geplaatst wordt?”. Tegelijk wordt ook de wereld waarover die vragen worden gesteld, steeds complexer. Om gedetailleerdere vragen over een complexere wereld te kunnen beantwoorden, moeten modellen die werkelijkheid beter benaderen. 3D is daardoor steeds noodzakelijker om antwoorden op maatschappelijke vragen te kunnen geven.

Naast de toenemende vraag zien we ook een aantal technologische doorbraken, die het mogelijk maken om tegen acceptabele kosten te voldoen aan die vraag naar actuele 3D modellen. In de komende jaren zullen landsdekkende 3D modellen beschikbaar gaan komen, op een schaalniveau vergelijkbaar met de BGT. De Nederlandse SDI zal dergelijke modellen aan moeten kunnen.

2.2 Meer linked data

In het Platform Linked Data Nederland, voorheen PiLOD, heeft Geonovum de afgelopen vier jaar samen met een actieve community onderzocht wat linked data is, hoe je het toepast, wat je eraan hebt, en hoe je geodata als linked data kunt publiceren en gebruiken. Ook het #geo4web testbed heeft inzichten hierover opgeleverd. Inmiddels hebben de eerste serieuze Nederlandse geo linked datasets het licht gezien, dankzij het Kadaster (Kadastrale percelen (BRK) en Topografie (BRT)).

Er zal de komende vijf jaar veel (overheids) linked geodata gepubliceerd worden. Naast Nederland hebben onder andere Ierland, Schotland, UK, Vlaanderen, Zwitserland en Finland al linked geodata gepubliceerd of zijn hier mee bezig. Linked data is belangrijk voor het publiceren van overheidsdata op een zo rijk mogelijke manier. Het maakt het mogelijk om de betekenis, de semantiek van de data direct aan de data zelf te koppelen, en om tot op een hoge granulariteit links tussen verschillende datasets te leggen. Kortom, linked data is belangrijk voor semantische interoperabiliteit en data integratie.

Linked data blijft naar onze verwachting ook de komende jaren wel enigszins een niche technologie. Voor het merendeel van de web developers blijft het te complex. Het blijft echter toch relevant, omdat het de meest rijke en krachtige manier is om data beschikbaar te stellen. In de context van open data is dat belangrijk. Daarnaast kan de data, ofwel door de data-eigenaar zelf, of door derden, op meer gangbare manieren beschikbaar gesteld worden. Overigens, "linked data" is niet per sé "Linked Data": wél elk object op het web met een eigen URI en links tussen de objecten; maar niet per sé met RDF, triple stores en SPARQL endpoints.

In 2017 verschijnt de W3C/OGC Spatial Data on the Web Best Practice. Dit document, waaraan wij mee schreven, gaat niet exclusief over linked data, maar bevat er veel aanbevelingen over uit de huidige praktijk en kan als leidraad dienen voor het publiceren van linked geo data in Nederland. Op een aantal punten is er volgens de Best Practice nog geen duidelijke, goede praktijk te ontwaren. Er moet de komende jaren bijvoorbeeld nog aan gewerkt worden aan een gestandaardiseerde vocabulaire voor geo-data én eentje voor geo-metadata.

In het verlengde van linked data ligt het semantic web. Langzaam maar zeker werken we hier naar toe. We denken daarbij aan semantische harmonisatie. Zonder de hele geowereld te willen harmoniseren, want dit zou een enorme klus zijn waarvan het praktisch nut niet vaststaat. Wel blijven we gericht, daar waar semantische harmonisatie leidt tot nieuwe mogelijkheden om data te hergebruiken en processen te optimaliseren, linked data principes toepassen om te komen tot een Web van data waarin niet langer overbodig data gekopieerd wordt.

2.3 Meer sensoren

Het gebruik van sensoren in de openbare ruimte neemt een enorme vlucht. Zo spreken de toepassingen voor openbare orde en veiligheid in het Living Lab Stratumseind tot de verbeelding, maar zien we ook tal van toepassingen op milieugebied (o.a. rond het meten van luchtkwaliteit), bereikbaarheid (o.a. rond doorstroming en beschikbare parkeerplekken) en de zelfrijdende auto. Veel toepassingen komen tot stand binnen Smart City-initiatieven of experimenten rond het Internet of Things. Met deze enorme groei in toepassingen, neemt ook het aantal standaardisatie-initiatieven snel toe. Internationale organisaties als OGC, W3C en IEEE werken allen aan standaarden op dit vlak. Deze standaarden richten zich zowel op het vastleggen van gegevens over sensoren als op het ontsluiten van door de sensoren ingewonnen gegevens. Hoewel het INSPIRE framework voorziet in standaarden voor het ontsluiten van sensordata, zijn er nog nauwelijks concrete toepassingen op dit vlak. In vergelijking met trends als meer 3D en meer linked data, is de sensortrend nog nieuwer en minder volwassen. Wel is een trend te zien naar lichtere standaarden, mede met het oog op het minimaliseren van dataverkeer (wat zeker bij LoRa van groot belang is) en het maximaliseren van batterijduur van bepaalde sensoren.

2.4 Meer gebruikers: Geo & World Wide Web

Via de Nederlandse SDI wordt een schat aan geo-informatie ontsloten, die voor het overgrote deel als open data wordt aangeboden. Toch beperkt het gebruik zich nu vaak tot het traditionele werkveld van de geo-informatie, terwijl juist de basisinformatie bruikbaar zou moeten zijn voor een veel bredere groep gebruikers. De intermediair tussen de data-aanbieder en de eindgebruiker is tegenwoordig steeds vaker een webontwikkelaar. Deze webontwikkelaars gebruiken nu echter slechts mondjesmaat de kwalitatief hoogwaardige geo-informatie via de Nederlandse SDI. Veel vaker kiezen ze voor platforms als Google Maps of Open Streetmap. Dit wordt veroorzaakt door een combinatie van factoren: deels komt dit voort uit onbekendheid met het bestaan en de opbouw van geo-informatie, deels uit het gegeven dat geo-informatie slecht vindbaar is via zoekmachines en deels uit het gebruik van specifieke geo-standaarden, die buiten het geo-domein veel onbekender zijn en daardoor een drempel voor web-ontwikkelaars. Uiteindelijk zorgt dit ervoor dat het hergebruik van open data slechts beperkt plaats vindt, waardoor niet het volledige potentieel aan maatschappelijke impact gerealiseerd kan worden. Webontwikkelaars spelen zeker in commerciële en op burgers gerichte toepassingen een belangrijke rol.

In een aantal recente initiatieven (o.a. het testbed Spatial data on the web en de gezamenlijke OGC en W3C-werkgroep Spatial data on the web) wordt gezocht naar mogelijkheden om de doelgroep van de Nederlandse SDI nadrukkelijk te verbreden tot buiten het traditionele geo-informatie domein. De wereld van de webontwikkelaar inclusief de in die wereld gangbare standaarden staat centraal. Oplossingsrichtingen schuilen onder andere in het gebruik van lichtere datastandaarden en het aanbieden van API's, codevoorbeelden en andere coördinaatsystemen. Ook wordt gewerkt aan het verbeteren van de vindbaarheid in zoekmachines. De Data on the Web Best Practices en mede door Geonovum geschreven Spatial Data on the Web Best Practices vormen een goed uitgangspunt.

2.5 Meer kanalen: platformgedachte

Alle hierboven beschreven ontwikkelingen roepen wellicht de vraag op of de huidige SDI nog wel zinvol is, en daarmee ook of de onderliggende set standaarden op de Pas toe of leg uit-lijst nog wel zinvol is. Om die vraag te kunnen beantwoorden, is een laatste ontwikkeling zeer relevant om te duiden: de opkomst van het platform. Dataplatformen kenmerken zich door de veelheid aan manieren waarop de data kan worden afgenomen: via downloads, via services, via API's of via SPARQL endpoints. De onderliggende reden voor deze veelheid is de erkenning van het gegeven dat er veel verschillende doelgroepen bestaan, met elk hun eigen toepassingen, die daarom ook elk hun data op een andere manier willen afnemen. De opkomst van platformen illustreert dat er niet langer naar een uniforme one size fits all aanpak wordt gestreefd, maar naar een multichannel aanpak, meer fit for purpose. Deze doelgroepspecifieke benadering is het gevolg van de focusverschuiving van ontsluiting van data naar (her)bruikbaarheid van data.

Met de opkomst van platformen, komt ook de vraag naar voren in hoeverre de huidige SDI al als platform beschouwd kan worden. Op dit moment lijkt de SDI primair gericht op de geoprofessional, inclusief standaarden uit de geowereld (OGC). Andere doelgroepen, zoals de webontwikkelaars, worden duidelijk minder goed ondersteund. Een platformbenadering zou passend zijn voor de SDI, waarmee de set standaarden uitgebreid kan worden met standaarden die lichter zijn en beter aansluiten bij de praktijk op het web. Mogelijk gaan dergelijke standaarden ook voor de geoprofessional steeds belangrijker worden, maar op korte termijn hebben de verschillende doelgroepen ook allemaal hun eigen behoeften.

3. Impact op Pas toe of leg uit-standaarden

3.1 Informatiemodel

NEN3610 fungeert niet alleen als moedermodel voor alle sectorale informatiemodellen, maar vormt ook een werkwijze voor het stelsel van sectorale informatiemodellen. Op beide aspecten zal NEN3610 zich de komende jaren verder ontwikkelen. Met de opkomst van Linked Data zien we dat steeds meer sectorale datasets 'verlinkt' worden. Op dit moment gebeurt dit op het niveau van individuele informatiemodellen. Het risico hiervan is dat we de samenhang, die nu bestaat tussen de verschillende informatiemodellen in de UML-wereld, verliezen in de Linked Data wereld. Daarom ontstaat de behoefte aan een Linked Data-profiel op NEN3610. Een dergelijk profiel zou alle begrippen moeten vastleggen in SKOS (Simple Knowlegde Organization System - W3C standaard, staat ook op de Pas toe of leg uit-lijst), de klassen en eigenschappen vastleggen in OWL (Web Ontology Language - W3C standaard), een set aanvullende modelleerrichtlijnen vastleggen en relaties specificeren met andere, gangbare vocabulaires. Met dit profiel geven we niet alleen richting aan het 'verlinken' van afzonderlijke informatiemodellen, maar bieden we ook meer context door de begrippen zoveel mogelijk te relateren aan breed gebruikte vocabulaires, zoals schema.org. Met beiden beogen we de 'linkbaarheid' van gegevens in de Nederlandse SDI zo groot mogelijk te maken, omdat dit zowel het gebruik (door betere vindbaarheid) als de bruikbaarheid (door beter begrip van de betekenis) vergroot.

Issue 5: Open world assumption

Op het semantisch web is het gebruikelijk om uit te gaan van de 'open world assumption'. Is het wenselijk / noodzakelijk om dit als uitgangspunt bij NEN3610 in te brengen, of is het wenselijker om uit te blijven gaan van de closed world assumption?

Vanuit Linked Data-perspectief is het beter vastleggen van relaties tussen begrippen een aandachtspunt voor de komende jaren, maar dit is zeker niet de enige drijfveer hiervoor. We zien dat met het verder volwassen worden van de SDI het aanbod aan datasets steeds verder toeneemt. En deze verschillende datasets bevatten ook steeds vaker gegevens over (schijnbaar) dezelfde objecten. Neem bijvoorbeeld wegen: steeds vaker wordt de vraag gesteld waarom de populaties van het NWB (Nationaal Wegenbestand), BGT (Basisregistratie Grootschalige Topografie) en BAG (Basisregistratie Adressen en Gebouwen) nu eigenlijk van elkaar verschillen. Experts uit het geodomein zijn vaak vertrouwd met dergelijke verschillen en kennen veelal de oorzaken, maar met het steeds bredere gebruik buiten het traditionele werkveld, neemt het aantal gebruikers dat dergelijke verschillen niet kan duiden steeds verder toe. Om hier mee om te kunnen gaan, is het noodzakelijk om inzicht te krijgen in de onderlinge relaties. Soms zal inzicht in de onderlinge relatie leiden tot begrip (bijvoorbeeld verschillende definities, die elk gerechtvaardigd zijn binnen hun eigen context), in andere gevallen kan dit reden zijn om bepaalde datasets te gaan harmoniseren. De definities van en onderlinge relaties tussen begrippen dienen centraal in conceptenregisters ontsloten te worden.

3.2 Uitwisselformaat

De Geography Markup Language (GML) staat als uitwisselformaat op de Pas toe of leg uit-lijst. GML wordt echter breder gebruikt binnen de SDI, bijvoorbeeld ook als formaat waarin een Web Feature Service (WFS) data terug kan geven. Uitspraken over toekomstige ontwikkelingen rond uitwisselstandaarden gelden daarom niet automatisch voor alle toepassingen van GML. Voordat we dergelijke uitspraken doen, is het goed om eerst de eisen die we vanuit de geosector stellen aan een uitwisselstandaard op een rij te zetten:

GML is nog steeds de enige open standaard die aan al deze criteria voldoet. Lichtere uitwisselstandaarden, waaronder GeoJSON, voldoen niet aan al deze criteria. GeoJSON gebruikt bijvoorbeeld alleen WGS'84 als coördinaatsysteem en ondersteunt niet alle geometrietypen (en sluit het uitbreiden met extra typen expliciet uit). Dit leidt ertoe dat de positie van GML als uitwisselformaat (bijvoorbeeld tussen bronhouders en landelijke voorzieningen) niet ter discussie staat. Daar waar lichtere formaten als mogelijke alternatieven worden genoemd, heeft dit eerder betrekking op het gebruik van GML bij ontsluiting van de data. Met de opkomst van 3D geo-informatie zou het overigens goed denkbaar zijn dat CityGML (als specifieke 3D aanscherping / uitbreiding op GML) toegevoegd zal worden aan de set geostandaarden op de Pas toe of leg uit-lijst.

Op de wat langere termijn zal het voorgaande statement over de positie van GML zijn geldigheid kunnen verliezen. Bij het Open Geospatial Consortium gaan stemmen op om een GeoJSON-achtige standaard te ontwikkelen die wel aan de eisen van de geo-sector voldoet. Ook verdere adoptie van linked data zou de zaken kunnen veranderen. Immers, met de opkomst van linked data is er geen strikte scheiding meer tussen het informatiemodel (de semantiek) en het uitwisselformaat (in de zin van het schema, waarmee de implementatie van een informatiemodel wordt vastgelegd). Met OWL (Web Ontology Language) leg je in de linked data wereld eigenlijk zowel het informatiemodel als het schema vast. Overigens is de term 'uitwisselen' sowieso niet langer van toepassing, omdat bij linked data data niet uitgewisseld (gekopieerd) wordt, maar je toegang krijgt tot data die beschikbaar is op het web.

3.3 Ontsluiting

Op het vlak van ontsluiting zijn de komende jaren de meeste ontwikkelingen te verwachten. Inzet van deze ontwikkelingen zijn het vergroten van het gebruik en de gebruiksvriendelijkheid van de SDI. Hiertoe zal het aanbod aan ontsluitingsmechanismen verbreden, waarbij -conform de platformgedachte- er voor verschillende doelgroepen ook verschillende ontsluitingen ondersteund zullen worden. Een professionele geo-gebruiker zal wellicht een volledige, op de centimeter nauwkeurige dataset willen krijgen als uitgangspunt voor ruimtelijke analyses, terwijl een webontwikkelaar behoefte kan hebben aan de globale locaties van oplaadpalen in een zo licht mogelijk formaat, zodat zijn app optimaal presteert.

Een categorie ontsluitingen die sterk in populariteit zal toenemen, wordt gevormd door de REST API's. REST API's verkleinen de hoeveelheid werk die een gebruiker (vaak een ontwikkelaar) moet verzetten om data daadwerkelijk binnen te krijgen, doordat REST API's geen service-specifieke bevragingen kennen, maar gebruik maken van het HTTP protocol. Om bijvoorbeeld een WFS te bevragen, zal een ontwikkelaar moeten snappen hoe een request opgebouwd moet worden, om succesvol data te verkrijgen. Dit vereist kennis (de ontwikkelaar dient de relevante (geo)standaard te begrijpen) en een implementatie-inspanning (om de standaard aan client-zijde te implementeren). Voor een ontwikkelaar die vertrouwd is met het geodomein vormt dit een drempel, voor ontwikkelaars van buiten het domein zal dit vaak een horde vormen die men niet kan of wil nemen. REST API's vereenvoudigen dataontsluiting niet alleen, maar zullen data vaak ook in lichtere formaten teruggeven en veel meer fit for purpose zijn: kleine 'convenience API's' die voor een specifiek doel precies de gewenste data teruggeven, in plaats van grote, generieke API's waarmee je elke mogelijke vraag zou kunnen stellen aan een dataset. Dit voorziet ook in de specifieke vragen die veel gebruikers stellen: lang niet iedereen wil 'de BGT', maar men wil bomen, parkeervakken of lichtmasten.

De vraag is nu in hoeverre de opkomst van REST API's vraagt om uitbreiding van de huidige set geostandaarden op de Pas toe of leg uit-lijst. Voor zover het gaat om internationale, generieke standaarden (OGC, ISO, W3C), kunnen we stellen dat REST API's geen geospecifieke standaarden kennen of vragen. Hiermee is aanpassing van de set geostandaarden niet aan de orde, hoogstens kunnen generieke standaarden aan de Pas toe of leg uit-lijst worden toegevoegd. Zo volgt bijvoorbeeld uit analyse in het discussiedocument 'RESTful APIs binnen de overheid' van het Forum Standaardisatie dat OAuth als authenticatiestandaard een wenselijke aanvulling vormt op de lijst. Ook de Data on the Web Best Practices, die veel algemene richtlijnen voor API's bevat, is een mogelijke kandidaat. Op dit niveau ligt aanpassing van de set geostandaarden dus niet voor de hand. De set geostandaarden bevat niet alleen internationale standaarden, maar ook een aantal Nederlandse profielen waarin dergelijke standaarden worden aangescherpt (de set bevat Nederlandse profielen voor WFS, WMS en metadata van datasets en services). Op dat niveau zou de opkomst van REST API's mogelijk wel om aanpassing van de set Geostandaarden vragen.

Issue 6: Noodzaak voor generieke API-strategie m.b.t. geo

In concepten van API-strategieën zien we aanvullende eisen voor het omgaan met geometrie. Voorbeelden hiervan zijn het voorschrijven van GeoJSON als formaat en methoden om met verschillende coördinaatsystemen om te gaan (iets wat niet standaard door GeoJSON wordt ondersteund). Heeft Nederland er baat bij wanneer dergelijke geo-aspecten uniform worden voorgeschreven in een Nederlands profiel voor geo in REST API's?

Wat betekent de opkomst van de REST API's voor de huidige OGC webservice standaarden? Nemen we -met het toenemende gebruik van generieke webstandaarden- afscheid van de geospecifieke standaarden? Dat zien we voorlopig niet gebeuren. Want in bijvoorbeeld het gemeentelijke applicatielandschap zien we een toenemend aantal applicaties dat via webservices een achtergrondkaart of luchtfoto ter referentie aanbiedt. En in Europese context zien we met INSPIRE ook een (wettelijk verankerde) toepassing van een op OGC-standaarden gebaseerde infrastructuur. Een andere indicator dat OGC webservices nog wel even deel blijven uitmaken van de Nederlandse SDI, zien we in sommige praktijkvoorbeelden waarbij de eerste stap richting API's wordt gezet door een interface aan te bieden die onder water de bestaande webservices bevraagd. Samengevat: we voorzien geen radicale overgang van OGC webservices naar API's. Tegelijk zien we wel mogelijkheden voor deze standaarden en profielen erop om door te ontwikkelen, om zo mee te evolueren met de veranderende vragen die aan de SDI gesteld worden. Op standaardniveau zien we dat de XML-requests behoorlijk zwaar zijn; het zou mooi zijn als dat lichter kan worden. Maar ook op het niveau van output zien we evolutie: het is wenselijk om meer keuze te bieden in outputformaten, inclusief lichtere formaten zoals GeoJSON daar waar dat past. Voor view services zien we evolutie richting vector tiling, waarmee de output van een WMS meer aanpassingsmogelijkheden voor styling biedt. Op het niveau van de Nederlandse profielen is zeker ook ruimte voor evolutie. Vanuit het oogpunt van bredere bruikbaarheid (inclusief voor het web) is het denkbaar om meer coördinaatsystemen voor te schrijven (bijv. niet alleen RD maar ook Web Mercator) en voor WFS meer outputformaten (bijv. minimaal GML en GeoJSON).

Op het punt van ontsluiting van 3D data zullen de standaarden zich nog verder moeten bewijzen. Mogelijk gaan OGC 3D portrayal services hier een rol in spelen, aangevuld met (nu nog kandidaat-) OGC Community Standards als 3D Tiling (o.b.v. Cesium) of I3S. De specifieke uitdaging van 3D data schuilt in het datavolume: zowel bij visualisatie- als downloadvoorzieningen moet nadrukkelijk rekening gehouden worden met performance en benodigde geheugencapaciteit en rekenkracht.

Voor de ontsluiting van Linked Data zullen API's een belangrijke rol spelen, maar zullen we meer SPARQL endpoints gaan zien. Deze endpoints maken het bevragen van Linked Data in RDF-structuur mogelijk. Het tempo waarin dergelijke endpoints gemeengoed gaan worden, zal mede afhangen van de snelheid waarmee triple stores gemeengoed worden. Op termijn is het goed denkbaar dat GeoSPARQL toegevoegd zal worden aan de set Geostandaarden op de Pas toe of leg uit-lijst.

Issue 7: NL-profiel op GeoSPARQL?

Voor ontsluiting via webservices worden aanvullende eisen gesteld in Nederlandse profielen op WMS en WFS. Voor aanbieders van API's zien we (via API strategieën) een vergelijkbare tendens. Dat roept de vraag op in hoeverre het noodzakelijk of wenselijk is om te komen met een Nederlands profiel op GeoSPARQL?

Issue 8: Ontsluiting van sensordata

Voor het ontsluiten van sensordata zijn op verschillende plaatsen standaarden in ontwikkeling. Zo wordt er gewerkt aan OGC standaarden (SOS, SensorThings API), maar ook aan W3C standaarden (o.a. SSN). Voor deze standaarden geldt dat ze -voor zover ze voldoende gereed zijn- nog maar zeer beperkt toegepast worden. Hiermee is het voor ons nu nog te vroeg om een uitspraak te doen over de wenselijke richting van standaarden voor het ontsluiten van sensordata.

Noot

Om ontsluiting van data te optimaliseren, zijn de aanbevelingen uit de W3C Data on the web en OGC/W3C Spatial data on the web Best Practices zeer waardevol. Om het effect van de aanbevelingen te maximaliseren, bekijkt Geonovum hoe deze aanbevelingen verder geformaliseerd kunnen worden. Er zijn meerdere opties denkbaar:

  • De W3C Data on the Web Best Practices heeft de status van W3C recommendation, hiermee zou die kunnen worden toegevoegd aan de Pas toe of leg uit-lijst (evt. in het optionele deel)
  • Mogelijk kunnen beide Best practices aan de set Geostandaarden worden toegevoegd. Deze optie zal met het Forum Standaardisatie verder verkend moeten worden.
  • De relevante aanbevelingen kunnen opgenomen worden in de verschillende Nederlandse profielen.
  • Als er meer Nederlandse profielen voor ontsluiting komen (naast webservices bijv. ook voor API's en GeoSPARQL), is het ook mogelijk om één Nederlands profiel voor ontsluiting op te stellen, waarbinnen de Best practices in het generieke deel kunnen worden opgenomen.

3.4 Vindbaarheid / metadata

Goede vindbaarheid van data is een cruciale voorwaarde voor verdere groei van het gebruik van geo-informatie en van de SDI. In de huidige SDI leunt vindbaarheid sterk op het concept van een metadata catalogus. Deze catalogus is als front-end zelf doorzoekbaar (o.a. op trefwoorden, categorieën, aanbieder en locatie) en ook ontsloten via een OGC catalogue service. Achilleshiel van deze aanpak is dat de zoekende partij de catalogus moet weten te vinden, of in elk geval een catalogus die gesynchroniseerd wordt met de geocatalogus, in Nederland het Nationaal Georegister. De mate waarin een gebruiker succesvol data kan vinden, wordt dus bepaald door het kennisniveau van de gebruiker (wat effectief neerkomt op de mate waarin de gebruiker vertrouwd is met het geodomein).

De vindbaarheid van geo-informatie kan aanzienlijk vergroot worden, wanneer zoekmachines de beschikbare data ook gaan indexeren. Metadata moet crawlable en machine readable worden. Tot nu toe wordt metadata in catalogi niet of nauwelijks geïndexeerd. Op dit moment lijkt de meest effectieve workaround het gebruik van landing pages voor data, een concept dat sowieso past in de huidige trend naar data platforms. Als voorbeeld kun je denken aan een nieuwe, volledig datagebaseerde website voor PDOK, waar je voor de BAG op een landing page terecht komt. Op zo'n centrale BAG pagina vind je idealiter de beschrijvende elementen (metadata), uitleg over de BAG (die nu verspreid staat over verschillende webpagina's), links naar alle vormen waarin de BAG wordt ontsloten (view- en downloadservices, APIs, linked data, BAG extract, ...) , ondersteuning in de vorm van helpdesk en forum (community) en een viewer om direct een indruk van de data te krijgen. In deze vorm krijgt metadata wellicht een minder herkenbare (afzonderlijke) front-end, maar wordt de catalogus meer een backend om metadata eenmalig en eenduidig vast te leggen. Op basis van deze backend kan ook nog steeds een OGC catalogue service draaien, die bijvoorbeeld voor INSPIRE verplicht is. De tendens voor de komende jaren rond metadata is hiermee vergelijkbaar met die rond OGC webservices voor ontsluiting: we verwachten de komende jaren een evolutie, gericht op betere aansluiting op het web. Richting Linked Data is de ontsluiting van metadata in RDF via het GeoDCAT applicatieprofiel een goed voorbeeld van een dergelijke evolutie: op deze wijze kan ISO-conforme metadata ook ontsloten worden richting andere open data portalen. Het verlaten van ISO-standaarden is op dit moment niet aan de orde: GeoDCAT-AP is een aanvullende ontsluiting van metadata richting de generieke open data wereld, maar geen vervanger. Bovendien zal INSPIRE ook ISO-conforme metadata blijven vragen.

Een ander belangrijk doel van metadata is om gebruikers te laten beoordelen of data bruikbaar is voor hun toepassing. Met een toenemend aantal gebruikers van buiten het geodomein, wordt deze functie van metadata alleen maar belangrijker. Het gaat hierbij niet alleen om inzicht in het 'wat' (waar heeft de dataset betrekking op), maar ook om het 'wie' (van wie is de dataset en belangrijker: wat zegt mij dat over de kwaliteit). Dit inzicht in de herkomst van data (de term provenance wordt hiervoor steeds gangbaarder) vormt een belangrijk argument om data wel of niet te gaan gebruiken.

4. Discussie

In deze white paper vragen we ons af of de huidige set geostandaarden toekomstvast is en schetsen we de ontwikkelingen van de komende vijf jaar. Deze schets is primair bedoeld om houvast te bieden bij stappen die leiden tot de doorontwikkeling van de Nederlandse SDI, maar secundair ook om inzicht te geven in de onderlinge relaties tussen innovatie- en beheerprojecten die Geonovum de afgelopen tien jaar heeft uitgevoerd. Inmiddels worden technieken uit een aantal innovatietrajecten dusdanig volwassen, dat ze impact gaan krijgen op de inrichting van de Nederlandse SDI.

Samenvattend kunnen we stellen dat de huidige SDI volwassen is, maar tegelijk zal moeten blijven ontwikkelen om duurzaam in te kunnen spelen op technologische en maatschappelijke ontwikkelingen. De opkomst van nieuwe technieken als Linked Data en de methoden van het web lijken niet disruptief te zijn: juist vanuit de doelgroepspecifieke benadering (niet langer one size fits all) en de platformgedachte zullen de huidige en toekomstige standaarden voorlopig parallel toegepast worden. Bovendien zien we huidige standaarden langzaam doorevolueren in de richting van de nieuwe technieken en standaarden, waardoor verschillen minder fundamenteel worden. Gebruikers van de Nederlandse SDI zullen hierdoor ook niet met radicale breuken op technologisch vlak worden geconfronteerd.

Het ontwikkelperspectief geeft globaal richting aan de doorontwikkeling van de standaarden die de ruggengraat van de Nederlandse SDI vormen, maar werpt tegelijk ook een aantal strategische keuzes op: