2012: Het jaar van het integreren van data

4 januari 2012 door Stefan de Konink

Nu de TOP10NL, BAG en het NWB op onze mat zijn gevallen kunnen we al een paar interessante dingen concluderen.

TOP10NL is prachtige geaggregeerde data, maar het ontbreekt aan meta data. Voorbeeldje: in de BAG zitten alle panden als losse geometrien. In TOP10 is een rijtje van huizen samengeveegd tot 1 object. TOP10NL is enorm uitgebreid in vormen, maar het ontbreekt aan metadata. Voorbeeldje: in het NWB hebben alle wegen een straatnaam. In TOP10 lijken sporadisch wat wegen een naam te hebben.

Klik op het plaatje voor een animatie.

11 Responses to “2012: Het jaar van het integreren van data”

  1. De Basisregistratie Topografie (BRT) is weliswaar een digitaal bestandscollectie, maar heeft tot nu toe als primair doel gehad om papieren kaarten te maken, of hooguit een schermafbeelding van een papieren kaart. Zo is de bestandscollectie verdeeld in 1 bestand per kaartblad! De straatnamen die soms tegenkomt in TOP10NL zijn dus de straatnamen die op een papieren kaart konden worden afgedrukt op die plek waar een beetje ruimte is: typisch in het buitengebied waar niet al te veel andere topografie te vinden is. De TOP10NL heeft tot nu toe nooit als doel gehad om geografisch volledig te zijn… Open data laat dus ook zien hoeveel waar we eigenlijk voor ons belastinggeld krijgen. Inderdaad: wat betreft de BRT valt dat vies tegen.

  2. Richard says:

    Wat bedoeld u met bestandcollectie verdeeld in 1 bestand per kaartblad?
    Voor de papieren kaart werd gebruik gemaakt van top25namen, niet de namen in top10nl.

  3. Stefan de Konink says:

    Nederland is in allemaal kleine rechthoekjes verdeeld. Elk rechthoekje is een GML bestand. Het is ook waarschijnlijk de enige manier om de data enigszins toegankelijk te maken in een standaard.

  4. Ivo says:

    De BRT is een kartografisch product, dat betekent dat de geometrieen bepaald worden door wat mooi en duidelijk is in de kaart (op papier of het scherm) daar zijn allerlei regels voor : smalle sloten zijn een lijn, brede sloten een vlak, en sloot die van breed naar smal naar breed gaat is dus een vlak met een lijn en een vlak. Twee gebouwen die vlak bij elkaar staan worden 1 bebouwd gebied, een gebouw dat volgens de top10 regels zelfstandig is kan worden verplaatst op de kaart (verder weg van het hoofdgebouw) om duidelijk te maken dat het een zelfstandig gebouw is.

    Dat levert mooie en heldere kaarten op, maar het is zeer onverstandig afstanden en oppervlakten in Top10 als geometrisch correct aan te nemen.

    Voor dingen als wandelpaden verwacht ik er wel voordeel van, die zijn nu eigenlijk nergens anders goed te vinden.

    Een mooi voorbeeld daarvan : http://www.rekenkamer.nl/dsresource?objectid=88325&type=org met de alinea

    “Ook waren
    de grenzen van de percelen niet voldoende nauwkeurig weergegeven en
    werden wijzigingen van landbouwers, resultaten van fysieke controles en
    herverkavelingen niet (nauwkeurig) verwerkt in het
    perceelsregistratiesysteem. Hierdoor gaf het Nederlandse
    perceelsregistratiesysteem een onvoldoende betrouwbaar beeld van de
    maximale oppervlakte waarvoor subsidie aangevraagd kan worden.
    Een belangrijke oorzaak hiervan was het gebruiken van topografische
    gegevens die minder nauwkeurig zijn dan de Europese Commissie vereist.
    DR maakte tot 2009 gebruik van het basisbestand topografie van het
    Kadaster: de TOP10. Dit is de digitale versie van de topografische kaart
    van Nederland met een schaal 1:10.000.”

    En dat schijnt dan te maken te hebben met dit : http://www.europa-nu.nl/id/vitkf9bn3uzi/nieuws/nederland_moet_2_24_miljoen_euro?ctx=vg9pir5eze8o&tab=2

  5. Ivo says:

    Komt Top25namen ook beschikbaar trouwens ?

  6. Stefan de Konink says:

    Die is al beschikbaar. Staat ook op de mirror 🙂

  7. In TOP10NL zitten ook geografische namen. Soms vier keer dezelfde bijelkaar: omdat een plaats bijvoorbeeld precies op de grens van 4 verschillende kaartbladen ligt… Ik was onder de indruk, dat top25namen een afgeleid product was van top10vector en niet gebruikt werd in het productieproces. Dank voor de verheldering. Helemaal met Stefan eens, dat het geografisch opdelen in kaartbladen ook handig is voor de gegevensverstrekking. GML is niet bepaald een compacte manier om dit soort grote gegevensbronnen uit te leveren.

  8. Stefan de Konink says:

    GML is niet bepaald een compacte manier om dit soort grote gegevensbronnen uit te leveren.

    Nee, dat is het zeker niet. Maar semantisch gezien waarschijnlijk wel het beste om het te leveren. Dan kun je er zeker wat mee, al kost het verwerken misschien wat extra tijd. Wat ik al op #osgeo had gevraagd, is er een ander (binair) open formaat dat geschikter is hiervoor. Wat iedereen theoretisch moet kunnen openen en semantiek toestaat?

    Opzich is gzip+gml vrijwel even groot als shape. Maar in sommige pakketten ontbreekt het gewoon aan een goede XML parser die de juiste indices op de juiste plekken zet. Maar goed als je het echt gaat gebruiken, zul je het toch in je eigen GIS omgeving moeten zetten…

  9. Maarten says:

    TOP10NL bevat wel degelijk metadata. Bij de levering wordt (als het goed is) de metadata als xml meegeleverd conform ISO19139/ISO19115. Verder worden ook de productspecificaties en de objectencatalogus met o.a. inwinningscriteria meegeleverd. Zie ook de stelselcatalogus van de basisregistraties: https://catalogus.stelselcatalogus.nl/StelselCatalogus/WAStelselcatalogus/basisregistratiecatalogi_algemene_specificaties/basisregistratie_catalogi/Topografie.

  10. Stefan de Konink says:

    Maarten, ja het bevat metadata. Maar straatnamen zijn optioneel in diezelfde standaard. Dus bruikbaar wordt het alleen door te combineren.

  11. Ellen Vos says:

    | | GML is niet bepaald een compacte manier om dit soort grote gegevensbronnen uit te leveren.

    | Opzich is gzip+gml vrijwel even groot als shape. Maar in sommige pakketten ontbreekt het gewoon aan een goede XML parser die de juiste indices op de juiste plekken zet. Maar goed als je het echt gaat gebruiken, zul je het toch in je eigen GIS omgeving moeten zetten…

    In de TOP10NL GML uitwerking zijn meerdere geometrien per object mogelijk (bijvoorbeeld een weg met een (hart-)lijn geometrie en daarnaast een polygoon geometrie behorend bij dezelfde weg). Niet alle softwaresystemen kunnen daarmee overweg, vandaar dat TOP10NL in GML formaat dan niet geladen kan worden.