Geonovum ontwikkelt en beheert de Nederlandse metadata profielen. Deze profielen zijn een verbijzondering van de internationale metadata standaarden van ISO en DCAT en zijn bedoeld om de interoperabiliteit binnen Nederland te bevorderen.
Dit document beschrijft de verdere specificatie van het toepassingsprofiel van [DCAT-AP-3.0] van de EU voor uitwisseling tussen gegevenscatalogi in Nederland. Het is een doorontwikkeling van [DCAT-AP-DONL-2.0].
Ten behoeve van de Europese High Value Dataset is de "usage guidelines of [DCAT-AP-HVD]" opgezet, als aanvulling op [DCAT-AP-2.1.1] . De vereisten uit de "usage guidelines of [DCAT-AP-HVD]" zijn opgenomen in dit Nederlandse profiel, zodat door te voldoen aan het Nederlandse profiel tevens aan de Europese vereisten voor Open data en High-Value Datasets kan worden voldaan.
Dit profiel wordt aangeboden voor opname op de Pas-toe-of-leg-uit-lijst van het College Standaardisatie.
Het Nederlandse profiel voor DCAT is niet statisch. Dit document wordt daarom onder beheer gebracht om wijzigingen naar behoefte en op basis van voorstellen gestructureerd door te voeren. Geonovum, als voorgestelde beherende instantie, zal de wijzigingen registreren.
Status van dit document
Dit is een door het TO goedgekeurde consultatieversie. Commentaar over dit document kan gestuurd worden naar [adres].
Conformiteit
Naast onderdelen die als niet normatief gemarkeerd zijn, zijn ook alle diagrammen, voorbeelden, en noten in dit document niet normatief. Verder is alles in dit document normatief.
De trefwoorden MAG, MOET en MOETEN in dit
document moeten worden geïnterpreteerd als in
BCP 14
[RFC2119] [RFC8174]
als, en alleen als deze in hoofdletters zijn weergegeven, zoals hier
getoond.
Inleiding
Dit onderdeel is niet normatief.
Om gestandaardiseerd metadata uit te wisselen tussen verschillende dataportalen heeft Europa het [DCAT-AP-3.0] ontwikkeld. [DCAT-AP-3.0] is gebaseerd op de "Data Catalog Vocabulary" (DCAT) -specificatie [DCAT-3.0], die wordt ontwikkeld door de Dataset Exchange Working Group. DCAT is een RDF-vocabulaire die ontworpen is om de interoperabiliteit tussen op het web gepubliceerde datacatalogi te vergemakkelijken. Dit profiel faciliteert de uitwisseling van metadata van verschillende domeinen tussen Nederlandse datacatalogi van (semi)overheidsorganisaties op lokaal, regionaal en landelijk nivo en tussen Nederlandse datacatalogi en EU datacatalogi, Het definieert het schema en geeft voorbeelden voor het gebruik ervan.
DCAT stelt een dataprovider in staat om datasets en dataservices in een catalogus te beschrijven met behulp van een standaardmodel en vocabulaire dat het gebruik en de aggregatie van metadata uit meerdere catalogi vergemakkelijkt. Dit kan de vindbaarheid van datasets en dataservices vergroten. Het maakt het ook mogelijk om een gedecentraliseerde benadering te hebben voor het publiceren van datacatalogi en maakt federatief zoeken naar datasets in catalogi op meerdere sites mogelijk met behulp van hetzelfde querymechanisme en dezelfde structuur.
In DCAT worden klassen en eigenschappen van andere gevestigde vocabulaires (ADMS, FOAF) hergebruikt. DCAT maakt gebruik van een bewezen set gemeenschappelijke metadata genaamd "Dublin Core", die in 2009 als ISO 15836-standaard werd gepubliceerd.
Dit document beschrijft het Nederlandse applicatieprofiel op [DCAT-AP-3.0]. Dit Nederlandse applicatieprofiel - DCAT-AP NL- beantwoordt de vraag over hoe [DCAT-AP-3.0] in de praktijk wordt toegepast Nederland.
Uitgangspunten
Bij het opstellen zijn van het applicatie profiel zijn volgende uitgangspunten gehanteerd:
Toepassingsbereik
DCAT-AP-NL faciliteert:
de uitwisseling van metadata tussen Nederlandse datacatalogi van (semi-) overheidsorganisatie en overige organisaties die maatschappelijke relevante data willen delen.
de uitwisseling van metadata tussen Nederlandse datacatalogi en EU datacatalogi
de uitwisseling van metadata van primair open data, maar is hier niet toe beperkt
de specifieke Nederlandse behoeften van metadata in datacatalogi
als je voldoet aan DCAT-AP NL voldoe je ook aan [DCAT-AP-3.0]
bevat alle verplichte en aanbevolen eigenschappen [DCAT-AP-3.0], waarbij de gebruiksvoorwaarden van DCAT-AP-NL gelden
introduceert geen uitbreidingen, als die al uitgedrukt kunnen worden in [DCAT-AP-3.0] of [DCAT-3.0] ,
tenzij er een hele sterke behoefte / aanleiding toe is, en het [DCAT-AP-3.0] of [DCAT-3.0] vocabulary hierin NIET voorziet
is zo generiek mogelijk van opzet en ligt zo dicht mogelijk bij [DCAT-AP-3.0]
is opgesteld in het Nederlands
Relatie andere profielen
Dit profiel is een verdere specificatie van het toepassingsprofiel van de Europa [DCAT-AP-3.0]. Hierbij zijn aanpassingen gedaan op basis van ervaring met DCAT-AP-DONL 1.1, 2.0 en onderzoek en discussies in de werkgroep DCAT-AP-NL en is aansluiting gezocht bij metadata standaarden uit het geo en statistische domein. DCAT-AP-NL is compatible met [DCAT-3.0] en [DCAT-AP-3.0] .
Om zoveel mogelijk scenario's te ondersteunen, verplichten de originele [DCAT-3.0] van het W3C en het toepassingsprofiel van de EU [DCAT-AP-3.0] weinig.
Op dit moment zijn [DCAT-3.0] en [DCAT-AP-3.0] als kandidaat release versie beschikbaar. Na het vaststellen van deze standaarden zal er gekeken worden of het DCAT-AP-NL profiel ook bijgewerkt moet worden.
1. Termen en definities
Een applicatieprofiel is een specificatie voor gegevensuitwisseling dat bijkomende beperkingen introduceert voor het toepassen van vocabularia. Dergelijke bijkomende beperkingen kunnen de volgende elementen bevatten:
verfijning van de terminologie (klassen en eigenschappen) consistent met de semantiek uit de betreffende specificaties met een welbepaald gebruik als doel;
externe terminologie (klassen en eigenschappen) gebruikt voor nieuwe/extra termen die niet in de bestaande vocabularia voorkomen.
meer nauwkeurigheid kan worden bereikt door klassen en klasse-attributen (eigenschappen) als verplicht, aanbevolen of optioneel te classificeren voor een bepaalde toepassing
Een dataportaal is een op het web gebaseerd systeem dat een gegevenscatalogus bevat waarin datasets worden beschreven met behulp van metadata. Bovendien biedt een dataportaal diensten aan om het vinden en het hergebruik van de datasets te bevorderen en/of te faciliteren.
Een dataset is een verzameling van samenhangende gegevens, die beheerd of gepubliceerd wordt door één organisatie. Een Dataset kan beschikbaar zijn via distributies of Data services.
Elke distributie is de werkelijke data van de dataset in een bepaald formaat of een bepaalde aanbiedingsvorm, die als bestand beschikbaar is voor hergebruik.
Services die toegang geven tot een of meer datasets of processing functies, zijn een dataservice.
Een dataset serie is een verzameling van datasets die een aantal gezamenlijke kenmerken heeft.
Een aanbieder is een gegevensaanbieder (bijvoorbeeld een dataportaal dat metadata verstrekt).
Een ontvanger is een gebruiker van gegevens (bijvoorbeeld een toepassing die metadata van een dataportaal verwerkt).
1.1 Namespaces
Dit toepassingsprofiel maakt gebruik van de namespaces zoals weergegeven in de onderstaande tabel.
Het toepassingsprofiel in dit document is gebaseerd op de specificatie van de Data Catalog Vocabulary (DCAT), ontwikkeld onder verantwoordelijkheid van de Government Linked Data Working Group van W3C. DCAT is een RDF-vocabulaire dat is ontworpen om interoperabiliteit tussen gegevenscatalogi gepubliceerd op het web te vergemakkelijken. Waar nodig worden aanvullende klassen en eigenschappen uit andere bekende vocabulaires hergebruikt.
Het DCAT vocabulaire bestaat uit klassen en eigenschappen.
Klassen beschrijven dingen:
Ze hebben niet allemaal een URI, maar het wordt aanbevolen om ze van een URI te voorzien. Een klasse beschrijft (complexe) dingen met vergelijkbare characteristieken zoals personen, organisaties, datasets of API's.
Klassen hebben eigenschappen: De eigenschappen zijn de attributen die deze dingen beschrijven. Sommige eigenschappen komen in meer dan één klasse voor, een titel bijvoorbeeld is een veel voorkomend attribuut. Andere eigenschappen zijn zeer gespecialiseerd, zoals een bestandsformaat dat alleen zinvol is voor een gegevensbestand.
Eigenschappen kunnen eenvoudig of complex zijn: sommige eigenschappen worden direct beschreven in bijvoorbeeld door mensen leesbare tekst of een datum (deze eigenschappen zijn ookwel owl:DatatypeProperty) en andere eigenschappen bevatten relaties naar andere objecten (een owl:ObjectProperty).
Over het algemeen kan een klasse herkend worden aan de schrijfwijze: De naam van een eigenschap begint met een kleine letter zoals dcat:dataset, terwijl de naam van een klasse begint met een hoofdletter zoals dcat:Dataset.
Klassen en eigenschappen worden gebruikt om de metadata op een gestructureerde manier aan te leveren.
2.2 Overzicht Klassen
Het volgende diagram geeft een overzicht van de basis functionaliteit van [DCAT-3.0] en dient als startblok voor het begrijpen van de constructie. LET OP, er zijn dus meer klassen, eigenschappen en relaties dan weergegeven zoals te zien in Klassen.
2.3 Optionaliteit
DCAT-AP NL definieert vier niveaus van vereisten voor ontvangers en aanbieders van gegevens. Daarbij geldt dat de niveaus alleen gelden voor de aanbieders. Om volledig te voldoen aan DCAT-AP NL MOETEN ontvangers altijd in staat zijn om informatie over alle instanties van alle klassen en al hun eigenschappen te verwerken. In de volgende secties worden klassen en eigenschappen aangeduid als "verplicht" (V), "aanbevolen" (A), "optioneel" (O) of "conditioneel" (C). Deze termen hebben de volgende betekenis:
Verplichte eigenschap: een ontvanger MOET de informatie voor die eigenschap kunnen verwerken; een aanbieder MOET de informatie voor die eigenschap verstrekken.
Aanbevolen eigenschap: een ontvanger MOET de informatie voor die eigenschap kunnen verwerken; een aanbieder BEHOORT de informatie voor die eigenschap te verstrekken indien deze beschikbaar is.
Optionele eigenschap: een ontvanger MOET de informatie voor die eigenschap kunnen verwerken; een aanbieder MAG de informatie voor die eigenschap verstrekken, maar is daartoe niet verplicht.
Conditionele eigenschap: een ontvanger MOET de informatie voor die eigenschap kunnen verwerken; een aanbieder MOET de informatie voor die eigenschap verstrekken, indien de conditie van toepassing is.
In de gegeven context betekent de term "verwerken" dat ontvangers binnenkomende gegevens MOETEN accepteren en deze gegevens op transparante wijze aan applicaties en diensten moeten leveren. Het impliceert noch schrijft voor wat applicaties en diensten uiteindelijk met de gegevens doen (parseren, converteren, opslaan, doorzoekbaar maken, weergeven aan gebruikers, etc.).
De termen MOET (MUST), BEHOORT (SHOULD) en MAG (MAY) in dit document moeten worden geïnterpreteerd als in BCP 14 en alleen als deze in hoofdletters zijn weergegeven, zoals hier getoond.
2.4 Waardelijsten
In de metadata dienen de waarden uit de waardelijsten waarnaar verwezen wordt bij de element beschrijving, gehanteerd te worden. Dit zijn vaak de door de EU verplichte waardelijsten.
De door de EU verplichte waardelijsten zijn "controlled vocabulaires", deze voldoen aan de volgende specificaties:
Worden gepubliceerd onder een open licentie.
Worden geëxploiteerd en/of onderhouden door een instelling van de Europese Unie, door een erkende standaardisatieorganisatie of een andere vertrouwde organisatie.
Zijn goed gedocumenteerd.
Zijn voorzien van labels in meerdere talen, idealiter in alle officiële talen van de Europese Unie.
Bevatten een relatief klein aantal termen (bijvoorbeeld 10-25) die algemeen genoeg zijn om een breed scala aan bronnen te kunnen classificeren.
Termen worden geïdentificeerd door URI's, waarbij elke URI wordt omgezet in documentatie over de term.
Hebben beleid voor persistentie en versiebeheer.
Deze criteria zijn niet bedoeld om gecontroleerde waardelijst in het algemeen te definiëren; ze geven een voorbeeld van mogelijke specificaties van gecontroleerde waardelijsten.
De (door de EU verplichte gecontroleerde) waardelijsten die in dit profiel gebruikt moeten worden zijn opgenomen in het hoofdstuk Waardelijsten
2.5 Omschrijving eigenschappen
Eigenschap: Dit is de originele engelstalige naam zoals gebruikt in de W3C specificatie van [DCAT-3.0] en [DCAT-AP-3.0].
Definitie: Dit is de Nederlandstalige definitie van de eigenschap.
RDF-eigenschap (URI): Dit is de (technische) naam van de eigenschap die van toepassing is voor de uitwisseling van de DCAT data.
Bereik: Het type (klasse of datatype) dat een waarde van deze eigenschap moet hebben.
Kardinaliteit: Geeft aan of de eigenschap 0, 1 of meerdere keren mag voorkomen. Hierbij wordt gebruik gemaakt van de schrijfwijze x..y, waarbij x het minimaal aantal voorkomens aangeeft en y het maximaal aantal.
Optionaliteit: Geeft aan of een eigenschap verplicht, aanbevolen, optioneel of conditioneel is.
Conditie: Geeft de conditie aan in het geval de optionaliteit Conditioneel is. Bijvoorbeeld HighValueData set.
Waardelijst: Een lijst van mogelijke waarden voor een eigenschap.
Herkomst: Geeft aan of de eigenschap overeenkomt met DCAT-AP. AP - is zoals beschreven in DCAT-AP; NL - is zoals beschreven in DCAT-AP en DCAT-AP HVD, echter met aanvullende restricties, condities, en toelichting op het gebruik van de eigenschap. Daarnaast zijn een aantal DCAT eigenschappen toegevoegd die geen onderdeel vormen van DCAT-AP.
Noot
2.6 Ondersteuning voor meertaligheid
Alle eigenschappen die voor mensen leesbare tekst bevatten (de range literal met een string waarde hebben) zoals bijvoorbeeld dct:title , dct:description, en dcat:keyword kunnen waardes in verschillende talen bevatten. Voor elke taal wordt de eigenschap herhaald met de toevoeging van een language tag om aan te geven in welke taal de waarde geschreven is.
Daarvoor wordt een waarde uit de waardelijst voor language toegepast: ISO 639-1 (two-letter)
3. Klassen
In dit hoofdstuk worden de belangrijkste klassen van het applicatieprofiel benoemd en beschreven. Deze klassen vormen de kern van het applicatieprofiel. De eigenschappen en de bijbehorende beperkingen die van toepassing zijn in de context van dit profiel worden in tabelvorm weergegeven. Elke rij komt overeen met één eigenschap. De eigenschappen worden in sub paragrafen verder toegelicht.
De niet beschreven klassen en eigenschappen behoren conform [DCAT-AP-3.0] toegepast te worden.
3.1 Dataset - dcat:Dataset
Een dataset is een zinvolle verzameling van samenhangende gegevens, die beheerd of gepubliceerd wordt door één organisatie, en in één of meer formaten beschikbaar of downloadbaar is.
Deze eigenschap bevat de wetgeving die de creatie of het beheer van de dataset verplicht stelt.
Er kunnen meerdere wetgevingen op de dataset van toepassing zijn. Denk aan HVD, INSPIRE, kaderrichtlijn water etc.
Deze eigenschap bevat een verwijzing naar de vastgestelde standaard of specificatie waaraan de beschreven dataset voldoet. Hierbij kan worden gedacht aan het informatie model, dataspecificatie of schema.
Gebruik de referentie naar de officiële publicatie van de standaard of specificatie.
Deze eigenschap bevat de contactinformatie waar eindgebruikers contact kunnen opnemen met vragen over de dataset. Dit element bevat het e-mail adres of link (URL) naar het contactformulier van de verantwoordelijke organisatie van de dataset. Het e-mail adres is een functioneel e-mailadres van de organisatie of organisatie onderdeel.
Property
contact point
Description
Contact information that can be used for sending comments about the Dataset.@en
De organisatie die verantwoordelijk is voor het creëren van de beschreven dataset. Gebruik bij voorkeur een URI of anders een waarde uit een organisatienamenlijst. Als dat niet mogelijk is, gebruik de volledig uitgeschreven naam van de verantwoordelijke organisatie. De afkorting kan toegevoegd worden aan de organisatienaam.
Een distributie is de werkelijke data van de dataset in een bepaald formaat of een bepaalde aanbiedingsvorm. Een dataset kan meerdere distributies hebben, bijvoorbeeld via een API of directe download in verschillende formaten. Deze eigenschap is verplicht, als de dataset onder de HVD uitvoeringsverordening valt.
Deze eigenschap bevat een beschrijving van de inhoud van de dataset. Deze is bij voorkeur minimaal drie zinnen en maximaal één alinea lang (2000 karakters). De vindbaarheid van de dataset wordt onder andere bepaald door de kwaliteit van de beschrijving. Denk hierbij aan verschillende gebruikers, vakgenoten maar ook anderen, waarvoor de tekst begrijpelijk moet zijn.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Het geografische gebied waarop de gegevens in de dataset betrekking hebben. De ruimtelijke dekking van een dataset kan worden gecodeerd als een dcterms:Location, of kan kan worden aangegeven met behulp van een URI-referentie (link) naar een bron die een locatie beschrijft.
Met dcterms:Location kunnen de eigenschappen bounding box, centroide of geometry worden beschreven. De coördinaten dienen te worden weergegeven volgens referentiesysteem WGS 84.
Voor de bounding box (Bbox) zijn de coördinaten zijn de meest westelijke, oostelijke, noordelijke en zuidelijke coördinaat uit de horizontale dekking van de dataset weergegeven in latitude en longitude in decimale graden (noord en oost als positieve waarden).
Identifier wordt gebruikt voor de unieke identificatie van de dataset. Dit is bij voorkeur een persistente URI die via HTTP raadpleegbaar is (resolvable). Hier wordt de oorspronkelijke identificatie van de dataset overgenomen zoals de data-eigenaar deze gepubliceerd heeft. De identifier mag niet door afnemers aangepast worden.
De eventuele andere identifiers worden in de eigenschap other identifier opgenomen, zoals bijvoorbeeld identifiers die door een catalog worden toegekend.
Identifier heeft de beperking (ten opzichte van DCAT-AP) dat deze eigenschap alleen de waarde kan bevatten die de eerste eigenaar heeft gegeven.
Property
identifier
Description
The main identifier for the Dataset, e.g. the URI or other unique identifier in the context of the Catalogue.@en
Deze eigenschap bevat in het algemeen gebruikte woorden of geformaliseerde zinnen om een dataset, dataservice of datasetserie te beschrijven, die niet uit een controlled vocabulary komen.
Het is mogelijk om meerdere keywords toe te kennen aan een dataset. Deze waarden moeten in afzonderlijke voorkomens van deze eigenschap worden aangeleverd.
Theme wordt gebruikt voor trefwoorden die uit een controlled vocabulary komen.
De webpagina die toegang geeft tot de dataset en aanvullende informatie verschaft over de dataset. Het gaat hierbij om de originele webpagina van de data-eigenaar.
Property
landing page
Description
A web page that provides access to the Dataset, its Distributions and/or additional information.@en
De waarde heeft alleen betrekking op de tekstuele waardes in de dataset zelf en niet op de taal van de metadata. De taal van de metadata wordt opgenomen in de eigenschap language van de klasse CatalogRecord.
In de eigenschap other identifier, kunnen eventuele overige identifiers in aanvulling op de identifier worden opgenomen, zoals identifiers die door een catalog worden toegekend. Eventueel kan naast de waarde van de identifier zelf, ook worden opgenomen wie deze toevoeging gedaan heeft. Hierdoor ontstaat een lijst met equivalente identifiers.
Het gebruik van other identifier wordt (ten opzichte van DCAT-AP) verder gespecificeerd, secundaire identifiers, zijn ook alle identifiers die aan de dataset zijn toegewezen tijdens het verwerken en delen van die dataset in het catalogusnetwerk.
Property
other identifier
Description
A secondary identifier of the Dataset, such as MAST/ADS17, DataCite18, DOI19, EZID20 or W3ID21.@en
Een verklaring van alle wijzigingen in eigendom en bewaring van een dataset sinds de creatie ervan, die van belang zijn voor de authenticiteit, integriteit en interpretatie ervan.
De meest precieze ruimtelijke resolutie in de dataset, gemeten in meters. Bij het publiceren van meerdere distributies van dezelfde dataset, elk met een verschillende resolutie - bijvoorbeeld de NUTS.status, kan deze eigenschap meerdere keren voorkomen.
Property
spatial resolution
Description
The minimum spatial separation resolvable in a dataset, measured in meters.@en
De meest precieze tijdsperiode in de dataset. Bij het publiceren van meerdere distributies van dezelfde dataset, elk met een verschillende resolutie kan deze eigenschap meerdere keren voorkomen.
Property
temporal resolution
Description
The minimum time period resolvable in the dataset.@en
Deze eigenschap bevat de categorie van de dataset. De waarde die voor deze eigenschap moeten worden gebruikt, is in ieder geval één URI van een concept uit Dataset Theme Vocabulary
Aanbevolen wordt om naast een waarde uit de Europese Dataset Theme Vocabulary ook in meerdere thema's waarden op te nemen uit domeinspecifieke vocabulaires.
keyword word gebruikt voor trefwoorden die niet uit een controlled vocabulary komen.
Op Europees niveau is nog een discussie gaande of naast een waarde uit Dataset Theme Vocabulary, waarden uit andere controlled vocabulary in deze of een andere eigenschap opgenomen kunnen worden.
https://github.com/SEMICeu/DCAT-AP/issues/316: Add guidance on usage of additional themes for datasets
Aanbevolen schrijfwijze voor deze eigenschap is: (projectkenmerk) onderwerp (locatiekenmerk) (tijdskenmerk) (versie). Hierbij zijn de onderdelen tussen haakjes niet verplicht, de andere wel. Afkortingen zijn in de titel enkel toegestaan indienen deze tevens zijn uitgeschreven bijvoorbeeld: “Grootschalige Basiskaart Nederland (GBKN)”.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Een distributie beschrijft hoe een (deel van) een dataset te verkrijgen is. Een distributie levert rechtstreeks een dataset in een specifiek formaat op, Verschillende distributies van dezelfde dataset verschillen van elkaar in o.a. taal, formaat, data-schema's en nauwkeurigheid (resolutie).
De aanbieder van een dataset kan distributies aanbieden in meerdere verschillende formaten en/of samenstellingen die zijn afgestemd op de behoeften van afnemers. Deze worden elk als afzonderlijke distributie beschreven en gerelateerd aan de dataset.
Als een dataset (ook) wordt aangeboden in de vorm van een dataservice of API kunnen hierover aanvullende gegevens worden opgenomen in een dcat:DataService. Deze kan worden gerelateerd aan de bijbehorende distributie.
De eigenschap access service beschrijft een dataservice. Een dataservice is een verzameling operaties die toegang biedt tot een of meer datasets of gegevens verwerkingsfuncties.
Property
access service
Description
A data service that gives access to the distribution of the dataset.@en
Deze eigenschap bevat de URL die toegang verschaft tot een distributie van de dataset.
De eigenschap access URL is verplicht in DCAT-AP, maar is niet altijd aanwezig, bijvoorbeeld als er alleen een rechtstreekse download link beschikbaar is, of alleen een access service of landingpage.. In die gevallen zal de inhoud van die eigenschappen ook opgenomen moeten worden in de access URL. De definitie van access URL wordt hierdoor in de meest ruime zin toegepast.
Per distributie kan er maar een access URL zijn.
Noot
Property
access URL
Description
A URL that gives access to a Distribution of the Dataset.@en
Deze eigenschap bevat de wetgeving die de creatie of het beheer van de dataset verplicht stelt.
Er kunnen meerdere wetgevingen op de distributie van toepassing zijn. Denk aan HVD, INSPIRE, kaderrichtlijn water etc.
De omvang van de distributie (het feitelijke bestand) in bytes.
Deze eigenschap is verplicht, als de dataset onder de Data Governance Act (DGA) valt.
De grootte wordt als een geheel, niet-negatief getal opgegeven, en kan eventueel worden benaderd als de precieze grootte niet bekend is, maar wel opgegeven moet worden.
De eigenschap checksum bevat de informatie waarmee een afnemer kan vaststellen of een gedownload bestand identiek is aan het aangeboden bestand (en er dus geen problemen zijn ontstaan bij het downloaden of wijzigingen zijn geweest aan de data zelf).
De checksum is gerelateerd aan downloadURL.
Property
checksum
Description
A mechanism that can be used to verify that the contents of a distribution have not changed.@en
De URL van het downloadbare bestand in een bepaald formaat. Bijvoorbeeld een CSV-bestand of een RDF-bestand. Dit formaat wordt aangegeven in de distributie in eigenschap dct:format.
Property
download URL
Description
A URL that is a direct link to a downloadable file in a given format.@en
De licentie waaronder de Distributie beschikbaar wordt gesteld.
Licenties zijn een aanvulling op dct:accessRights. Als de data (publiek) toegankelijk zijn, staan in de licentie de voorwaarden voor het (her)gebruik daarvan.
Gebruik van Creative Commons Licenties (CC) is vereist. Aanbevolen wordt om steeds de meest recente versie van een licentie te gebruiken.
In het geval geen (her)gebruik volgens een CC-licentie mogelijk is, mag de waarde ‘niet-open' gebruikt worden. Dat laatste kan bijv. voorkomen als een dataset alleen onder voorwaarden toegankelijk is.
Gebruik dcterms:rights voor alle andere typen voorwaarden – indien die niet gedekt worden door dcterms:license en dcterms:accessRights, zoals copyright-verklaringen.
Noot
Property
licence
Description
A licence under which the Distribution is made available.@en
Een verklaring waarin de rechten die verband houden met de distributie worden gespecificeerd. Hierin worden alleen de overige rechten opgenomen die niet gedekt worden door license of acces rights.
Deze eigenschap is verplicht, als de dataset onder de Data Governance Act (DGA) valt.
Property
rights
Description
A statement that specifies rights associated with the Distribution.@en
Aanbevolen schrijfwijze voor deze eigenschap is: (projectkenmerk) onderwerp (locatiekenmerk) (tijdskenmerk) (versie). Hierbij zijn de onderdelen tussen haakjes niet verplicht, de andere wel. Afkortingen zijn in de titel enkel toegestaan indienen deze tevens zijn uitgeschreven bijvoorbeeld: “Grootschalige Basiskaart Nederland (GBKN)”.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Onderstaand voorbeeld beschrijft een dcat:Distribution met de verplichte en aanbevolen en enkele conditionele eigenschappen. Dit is een verdere uitwerking van het voorbeeld bij dcat:Dataset
Onderstaand voorbeeld beschrijft een dcat:Distribution die een dataservice ontsluit. Dit is een verdere uitwerking van het voorbeeld bij dcat:Dataset
3.3 DataService - dcat:DataService
Een gegevensdienst of dataservice is een computer service waar gegevens opgevraagd worden aan de hand van specificaties in een aanvraag. De gegevens die voldoen aan de meegegeven specificatie worden als antwoord teruggestuurd. Webservices zoals REST/JSON, WMS of XML interfaces zijn voorbeelden van dcat:DataService. Merk op dat als de specificatie slechts een deel van de gegevens beschrijft, alleen desbetreffende subset wordt opgestuurd. Ook is het mogelijk dat een dataservice niet één, maar meerdere datasets ontsluit.
Dataservice zijn speciaal bedoeld voor geautomatiseerde koppelingen tussen systemen, hoewel ze ook door - meestal technisch onderlegde - mensen gebruikt kunnen worden.
De dataservice klasse is geïntroduceerd in versie 2 van DCAT. Het biedt uitgebreidere mogelijkheden om geautomatiseerde toegang tot gegevens te beschrijven dan mogelijk is in de klasse dcat:Distributie. In deze nieuwe versie van het toepassingsprofiel is de dataservice klasse optioneel.
Deze eigenschap bevat de wetgeving die de creatie of het beheer van de dataservice verplicht stelt.
Er kunnen meerdere wetgevingen op de dataset van toepassing zijn. Denk aan HVD, INSPIRE, kaderrichtlijn water etc.
Deze eigenschap bevat een verwijzing naar een (technische) vastgestelde standaard of specificatie waaraan de beschreven dataservice voldoet. Bijvoorbeeld een API features standaard http://www.opengis.net/def/interface/ogcapi-features.
Gebruik de referentie naar de officiële publicatie van de standaard of specificatie.
Deze eigenschap is verplicht, als de dataservice onder de HVD uitvoeringsverordening valt.
De standaard waarnaar hier wordt verwezen, behoort de dataservice te beschrijven en niet de bijbehorende dataset. De dataservice voldoet bijvoorbeeld aan de OGC API-features standaard, terwijl de bijbehorende dataset voldoet aan het INSPIRE Address dataspecificatie.
Deze eigenschap bevat de contactinformatie waar eindgebruikers contact kunnen opnemen met vragen over de dataservice. Dit element bevat het e-mailadres of link (URL) naar het contactformulier van de verantwoordelijke organisatie van de dataset. Het e-mail adres is een functioneel e-mailadres van de organisatie of organisatie onderdeel.
De organisatie die verantwoordelijk is voor het creëren van de beschreven dataservice. Gebruik bij voorkeur een URI of anders een waarde uit een organisatienamenlijst. Als dat niet mogelijk is, gebruik de volledig uitgeschreven naam van de verantwoordelijke organisatie. De afkorting kan toegevoegd worden aan de organisatienaam.
Deze eigenschap bevat een beschrijving van de inhoud van de dataservice. Deze is bij voorkeur minimaal drie zinnen en maximaal één alinea lang (2000 karakters). De vindbaarheid van de dataservice wordt onder andere bepaald door de kwaliteit van de beschrijving. Denk hierbij aan verschillende gebruikers, vakgenoten maar ook anderen, waarvoor de tekst begrijpelijk moet zijn.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Een pagina of document over de dataservice met aanvullende informatie.
De informatie over de kwaliteit van de dienstverlening wordt beschouwd als onderdeel van de generieke documentatie van een dataservice. Voor HVD moet dit verplicht worden opgenomen.
Deze eigenschap beschrijft de specifieke details van de dataservice, zoals de operaties die beschikbaar zijn voor deze dataservice via de end-point instanties, inclusief hun werking en parameters
Een beschrijving van een eindpunt kan worden uitgedrukt in een machine leesbare vorm, zoals een [OpenAPI] (Swagger) beschrijving, een OGC GetCapabilities aanroep [WFS], [WMS] [ISO-19128], een [SPARQL11-SERVICE-DESCRIPTION], een [OpenSearch] of [WSDL20] document, een Hydra API beschrijving [HYDRA], anders in tekst of een andere informele vorm als een formele representatie niet mogelijk is.
In application profile wordt verwezen naar de algemene (technische) standaard of specificaties waaraan de beschreven dataservice voldoet
Property
endpoint description
Description
A description of the services available via the end-points, including their operations, parameters etc.@en
De hoofdlocatie of het primaire eindpunt van de service (een IRI).
De eindpunt-URL MOET persistent zijn. Dit betekent dat uitgevers er alles aan moeten doen om de waarde stabiel en bestaand te houden.
Property
endpoint URL
Description
The root location or primary endpoint of the service (an IRI).@en
Deze eigenschap bevat de HVD-categorie waartoe de datasets die in de dataservice worden ontsloten, behoort, als die dataset onder de HVD uitvoeringsverordening valt.
Identifier wordt gebruikt voor de unieke identificatie van de dataservice. Dit is bij voorkeur een persistente URI die via HTTP raadpleegbaar is (resolvable). Hier wordt de oorspronkelijke identificatie van de dataservice overgenomen zoals de data-eigenaar deze gepubliceerd heeft. De identifier mag niet door afnemers aangepast worden.
De eventuele andere identifiers worden in de eigenschap other identifier opgenomen, zoals bijvoorbeeld identifiers die door een catalog worden toegekend.
Identifier heeft de beperking (ten opzichte van DCAT-AP) dat deze eigenschap alleen de waarde kan bevatten die de eerste eigenaar heeft gegeven.
Deze eigenschap bevat in het algemeen gebruikte woorden of geformaliseerde zinnen om de dataservice te beschrijven, die niet uit een controlled vocabulary komen.
Het is mogelijk om meerdere keywords toe te kennen aan een dataservice. Deze waarden moeten in afzonderlijke voorkomens van deze eigenschap worden aangeleverd.
Theme word gebruikt voor trefwoorden die uit een controlled vocabulary komen.
De webpagina die toegang geeft tot de dataservice en aanvullende informatie verschaft over de dataservice. Het gaat hierbij om de originele webpagina van de aanbieder van de dataservice.
De waarde heeft alleen betrekking op de tekstuele waardes in de dataservice zelf en niet op de taal van de metadata. De taal van de metadata wordt opgenomen in de eigenschap language van de klasse CatalogRecord.
De licentie waaronder de dataservice beschikbaar wordt gesteld.
Licenties zijn een aanvulling op dct:accessRights. Als de data (publiek) toegankelijk zijn, staan in de licentie de voorwaarden voor het (her)gebruik daarvan.
Gebruik van Creative Commons Licenties is vereist. Aanbevolen wordt om steeds de meest recente versie van een licentie te gebruiken.
In het geval geen (her)gebruik volgens een CC licentie mogelijk is, mag de waarde ‘niet-open' gebruikt worden. Dat laatste kan bijvoorbeeld voorkomen als een dataset alleen onder voorwaarden toegankelijk is.
Gebruik dcterms:rights voor alle andere typen voorwaarden – indien die niet gedekt worden door dcterms:license en dcterms:accessRights, zoals copyright-verklaringen.
Noot
Property
licence
Description
A licence under which the Data service is made available.@en
In de eigenschap other identifier, kunnen eventuele overige identifiers in aanvulling op de identifier worden opgenomen, zoals identifiers die door een catalog worden toegekend. Eventueel kan naast de waarde van de identifier zelf, ook worden opgenomen wie deze toevoeging gedaan heeft. Hierdoor ontstaat een lijst met equivalente identifiers.
Het gebruik van other identifier wordt (ten opzichte van DCAT-AP) verder gespecificeerd, secundaire identifiers, zijn ook alle identifiers die aan de dataservice zijn toegewezen tijdens het verwerken en delen van die dataset in het catalogusnetwerk.
Een verklaring waarin de rechten die verband houden met de dataservice worden gespecificeerd. Hierin worden alleen de overige rechten opgenomen die niet gedekt worden door license of acces rights.
Property
rights
Description
A statement that specifies rights associated with the Data Service.@en
Deze eigenschap bevat de categorie van de dataservice. De waarde die voor deze eigenschap moeten worden gebruikt, is in ieder geval één URI van een concept uit Dataset Theme Vocabulary
Aanbevolen wordt om naast een waarde uit de Europese Dataset Theme Vocabulary ook in meerdere thema's waarden op te nemen uit domeinspecifieke vocabulaires.
keyword word gebruikt voor trefwoorden die niet uit een controlled vocabulary komen.
Op Europees niveau is nog een discussie gaande of naast een waarde uit Dataset Theme Vocabulary, waarden uit andere controlled vocabulary in deze of een andere eigenschap opgenomen kunnen worden.
https://github.com/SEMICeu/DCAT-AP/issues/316: Add guidance on usage of additional themes for datasets
In https://semiceu.github.io/DCAT-AP/releases/3.0.0/#controlled-vocs is het gebruik van de EU waardelijst niet opgenomen, we verwachtten dat dit wel de bedoeling is.
Aanbevolen schrijfwijze voor deze eigenschap is: (projectkenmerk) onderwerp (locatiekenmerk) (tijdskenmerk) (versie). Hierbij zijn de onderdelen tussen haakjes niet verplicht, de andere wel. Afkortingen zijn in de titel enkel toegestaan indienen deze tevens zijn uitgeschreven bijvoorbeeld: “Grootschalige Basiskaart Nederland (GBKN)”.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Deze eigenschap bevat de wetgeving die de creatie of het beheer van de catalogus verplicht stelt.
Er kunnen meerdere wetgevingen op de catalogus van toepassing zijn. Denk aan HVD, INSPIRE, kaderrichtlijn water etc.
Deze eigenschap bevat de contactinformatie waar eindgebruikers contact kunnen opnemen met vragen over de catalogus. Dit element bevat het e-mail adres of link (URL) naar het contactformulier van de verantwoordelijke organisatie van de dataset. Het e-mail adres is een functioneel e-mailadres van de organisatie of organisatie onderdeel.
Property
contact point
Description
Contact information that can be used for sending comments about the Catalogue.@en
De organisatie die verantwoordelijk is voor het creëren van de beschreven catalogus. Gebruik bij voorkeur een URI of anders een waarde uit een organisatienamenlijst. Als dat niet mogelijk is, gebruik de volledig uitgeschreven naam van de verantwoordelijke organisatie. De afkorting kan toegevoegd worden aan de organisatienaam.
Deze eigenschap bevat een beschrijving van de inhoud van de catalogus. Deze is bij voorkeur minimaal drie zinnen en maximaal één alinea lang (2000 karakters). De vindbaarheid van de catalogue wordt onder andere bepaald door de kwaliteit van de beschrijving. Denk hierbij aan verschillende gebruikers, vakgenoten maar ook anderen, waarvoor de tekst begrijpelijk moet zijn.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Het geografische gebied waarop de gegevens in de catalogus betrekking hebben. De ruimtelijke dekking van een catalogus kan worden gecodeerd als een dcterms:Location, of kan kan worden aangegeven met behulp van een URI-referentie (link) naar een bron die een locatie beschrijft.
Met dcterms:Location kunnen de eigenschappen bounding box, centroide of geometry worden beschreven. De coördinaten dienen te worden weergegeven volgens referentiesysteem WGS 84.
"Voor de Bbox zijn de coördinaten zijn de meest westelijke, oostelijke, noordelijke en zuidelijke coördinaat uit de horizontale dekking van de catalogus weergegeven in latitude en longitude in decimale graden (noord en oost als positieve waarden)."
De homepage van de catalogus. Een catalogus kan op meerdere dataportals worden gepubliceerd. Deze eigenschap verwijst naar de originele homepage. Dat is in de regel de homepage van de maker van de catalogus.
Property
homepage
Description
A web page that acts as the main page for the Catalogue.@en
Een verklaring waarin de rechten die verband houden met de catalogus worden gespecificeerd. Hierin worden alleen de overige rechten opgenomen die niet gedekt worden door license of acces rights.
Property
rights
Description
A statement that specifies rights associated with the Catalogue.@en
Aanbevolen schrijfwijze voor deze eigenschap is: (projectkenmerk) onderwerp (locatiekenmerk) (tijdskenmerk) (versie). Hierbij zijn de onderdelen tussen haakjes niet verplicht, de andere wel. Afkortingen zijn in de titel enkel toegestaan indienen deze tevens zijn uitgeschreven bijvoorbeeld: “Grootschalige Basiskaart Nederland (GBKN)”.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Onderstaand voorbeeld beschrijft een dcat:Catalog met de verplichte een aantal aanbevolen eigenschappen.
3.5 CatalogRecord - dcat:CatalogRecord
Een beschrijving van de in de catalogus opgenomen beschrijvingen van een dataset of data service. Hierin worden eigenschappen van de beschrijving zelf vastgelegd, zoals bijvoorbeeld de standaard waaraan de beschrijving voldoet. Voor High Value Datasets kan dat bijvoorbeeld ook DCAT-AP-HVD zijn, naast DCAT-AP en DCAT-AP-NL. Daarnaast kan er ook verwezen worden naar de originele metagegevens (conform een andere standaard) die zijn gebruikt bij het genereren van de beschrijving in DCAT.
Deze eigenschap bevat een verwijzing naar een (technische) vastgestelde standaard of specificatie waaraan de beschrijving van de dataset of dataservice in de catalogus voldoet.
Gebruik de referentie naar de officiële publicatie van de standaard of specificatie.
De standaard waarnaar hier wordt verwezen, behoort de metadata te beschrijven, bijvoorbeeld DCAT-AP-HVD https://semiceu.github.iodcat-ap/releases/2.2.0-hvd
Property
application profile
Description
An Application Profile that the Dataset's metadata conforms to.@en
Deze eigenschap bevat de taal die wordt gebruikt in de metadata beschrijving, om onder andere de titel en andere tekstuele beschrijvingen, in het catalog record vast te leggen.
Onderstaand voorbeeld beschrijft een dcat:CatalogRecord met de verplichte een aantal aanbevolen eigenschappen.
3.6 DatasetSeries - dcat:DatasetSeries
Een datasetseries is een verzameling van datasets die afzonderlijk worden gepubliceerd, maar bepaalde kenmerken delen waardoor ze gegroepeerd zijn. Er moet tenminste één dataset verwijzen naar een datasetseries middels de eigenschap dcat:inSeries.
Deze eigenschap bevat de wetgeving die de creatie of het beheer van de dataset serie verplicht stelt.
Er kunnen meerdere wetgevingen op de dataset serie van toepassing zijn. Denk aan HVD, INSPIRE, kaderrichtlijn water etc.
Deze eigenschap bevat de contactinformatie waar eindgebruikers contact kunnen opnemen met vragen over de dataset serie. Dit element bevat het e-mail adres of link (URL) naar het contactformulier van de verantwoordelijke organisatie van de dataset. Het e-mail adres is een functioneel e-mailadres van de organisatie of organisatie onderdeel.
Property
contact point
Description
Contact information that can be used for sending comments about the Dataset Series.@en
Deze eigenschap bevat een beschrijving van de inhoud van de dataset serie. Deze is bij voorkeur minimaal drie zinnen en maximaal één alinea lang (2000 karakters). De vindbaarheid van de dataset serie wordt bepaald door de kwaliteit van de tekst. Denk hierbij aan verschillende gebruikers, vakgenoten maar ook anderen, waarvoor de tekst begrijpelijk moet zijn.
Het wordt aanbevolen om een indicatie te geven van de dimensies waarin de dataset serie zich ontwikkelt.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Het geografische gebied dat wordt gedekt door de dataset serie. De ruimtelijke dekking van een dataset serie kan worden gecodeerd als een dcterms:Location, of kan kan worden aangegeven met behulp van een URI-referentie (link) naar een bron die een locatie beschrijft.
Met dcterms:Location kunnen de eigenschappen bounding box, centroide of geometry worden beschreven. De coördinaten dienen te worden weergegeven volgens referentiesysteem WGS 84.
"Voor de Bbox zijn de coördinaten zijn de meest westelijke, oostelijke, noordelijke en zuidelijke coördinaat uit de horizontale dekking van de dataset serie weergegeven in latitude en longitude in decimale graden (noord en oost als positieve waarden)."
Voor specifiekere aanduidingen, zoals wijken en buurten kan aanvullend gebruik worden gemaakt van https://vocabs.cbs.nl/nl/
Als de spatial coverage een dimensie is in de dataset series, dan moet de spatial coverage van elke dataset in de verzameling deel uitmaken van de dataset serie. In dat geval wordt een open waarde aanbevolen, bv. EU of een brede bounding box die de verwachte waarden omvat.
Property
geographical coverage
Description
A geographic region that is covered by the Dataset Series.@en
De tijdsperiode waar de dataset serie betrekking op heeft.
Als de temporal coverage een dimensie is in de dataset serie, dan moet de temporal coverage van elke dataset in de verzameling deel uitmaken van de dataset serie. In dat geval wordt een open waarde aanbevolen, die de verwachte waarden omvat.
Property
temporal coverage
Description
A temporal period that the Dataset Series covers.@en
Aanbevolen schrijfwijze voor deze eigenschap is: (projectkenmerk) onderwerp (locatiekenmerk) (tijdskenmerk) (versie). Hierbij zijn de onderdelen tussen haakjes niet verplicht, de andere wel. Afkortingen zijn in de titel enkel toegestaan indienen deze tevens zijn uitgeschreven bijvoorbeeld: “Grootschalige Basiskaart Nederland (GBKN)”.
Deze eigenschap kan alleen worden herhaald om de waarde in een andere taal weer te geven. Zie meertaligheid voor het omgaan met verschillende talen.
Onderstaand voorbeeld laat voor twee datasets de eigenschap zien die aangeeft dat ze onderdeel uitmaken van een DatasetSerie. De dcat:DatasetSeries bevat de verplichte eigenschappen.
In de metadata dienen de waarden uit de waardelijsten waarnaar verwezen wordt bij de element beschrijving, gehanteerd te worden. Dit zijn vaak de door de EU verplichte waardelijsten.
In de onderstaande tabel worden eigenschappen opgesomd met gecontroleerde waardelijsten die voor de genoemde eigenschappen MOETEN worden gebruikt.
Voor Europese instellingen en een klein aantal internationale organisaties moet de EU Vocabularies Corporate bodies Named Authority List worden gebruikt.
Bij andere soorten organisaties moeten nationale, regionale of lokale woordenlijsten worden gebruikt, zoals bijvoorbeeld Register Overheid-Organisaties, Research Organization Registry (ROR) of Core Business Vocabulary (organisaties)
Alle gegevensregels in dit profiel zijn ook uitgedrukt in SHACL. Met behulp van deze regels kan gevalideerd worden of een dataset beschrijving voldoet aan dit profiel.
De SHACL regels van DCAT-AP-NL bouwen voort op de SHACL regels uit [DCAT-AP]. Alle regels uit [DCAT-AP] zijn daarbij nog steeds van toepassing. DCAT-AP-NL scherpt enkel sommige gegevensregels aan.
In figuur X is te zien hoe de shapes van DCAT-AP, DCAT-AP-NL en High-Value Datasets zich tot elkaar verhouden. Hierin is te zien dat DCAT-AP-NL gepositioneerd is tussen DCAT-AP en High-Value Datasets in, waarbij DCAT-AP de minst strenge eisen stelt en High-Value Datasets extra eisen kent.
Om te toetsen of een datasetbeschrijving voldoet aan DCAT-AP-NL is het ook noodzakelijk om zowel de DCAT-AP SHACL shapes als de DCAT-AP-NL SHACL shapes mee te nemen in de validatie. Mocht je een High-Value-Dataset-beschrijving willen valideren dan moet ook die set shapes extra worden meegenomen.
De redactie is alle leden van de werkgroep dankbaar voor hun bijdragen aan dit document en tevens ook de personen die eerder een bijdrage geleverd hebben aan DCAT-AP-DONL 2.0 waarvan dankbaar gebruik gemaakt is.
OpenAPI. Darrell Miller; Jeremy Whitlock; Marsh Gardiner; Mike Ralphson; Ron Ratovsky; Uri Sarid; Tony Tam; Jason Harmon. URL: https://www.openapis.org/