Gå til sidens indhold

Tilknytning af geografiske data

Danmarks Statistiks registerdata kan suppleres med geografiske data. Det kan for eksempel være information om geografiske områder (som klynger og polygoner) eller afstandsoplysninger mellem en persons bopæl og diverse institutioner, såsom sygehuse, praktiserende læge, arbejdssted eller uddannelsesinstitutioner.

Danmarks Datavindue kan vejlede og løse opgaver inden for følgende områder:

  • Kvadratnet
  • Klynger
  • Polygoner/udarbejdelse af landkort
  • Afstandsberegninger, herunder vejafstande
  • Oplandsanalyser/populationsdannelser
  • Spørgsmål om diskretionering
  • Validering af brugeres geografiske inddelinger

Hvis du har en opgave, der ligger uden for disse kategorier, er du stadig velkommen til at kontakte os. Vi sparrer gerne om mulighederne for, hvorvidt og hvordan opgaven kan løses.

Når sådanne geografiske data kobles til registerdata, skal de dokumenteres i DDV App og leve op til Danmarks Statistiks særlige krav til diskretionering af geografiske data.

Eksempler på opgaver

Case 1: Oplandsanalyse af kystnær bebyggelse

Nogle kommuner ved den jyske vestkyst ønsker at se på, hvordan lovgivning i 2017, der muliggør kystnær bebyggelse, påvirker området på en række parametre, bl.a.:

  • Betydning for prisudvikling på ejendomme
  • Betydning for kommunens sammensætning af borgere
  • Betydning for erhverv/arbejdspladser/institutionspladser
  • Risici for storm og vandskader i takt med det kystnære byggeri. Herunder udvikling/revidering af klasser for risikozoner for bygninger og anlæg.

Dannelse af klynger

Brugeren blev rådgivet af Danmarks Datavindue om at anvende klynger, der blev afgrænset ud fra afstandsparametre fra kysten. Klyngerne blev dannet som en konstant afstand fra kysten, hvor der blev underinddelt i 0-500 m, 500-1000 m og 1000-1500 m fra kysten. Der blev derved defineret et begrænset antal klynger, idet klyngerne også blev afgrænset i forhold til, hvilken kommune de lå i.

Muligheder for at udbrede analysen

Med oplysninger om hvilke adresser der tilhører de enkelte klynger, fik brugeren mulighed for at se, hvordan de parametre, man gerne ville undersøge, udviklede sig inden for de enkelte klynger.

Samtidig var der med den inddeling taget højde for, at klyngerne havde en tilstrækkelig størrelse, som sikrer den nødvendige diskretionering, dvs. mindst 50 husstande i hver klynge.

Leveringstid

Opgaven blev leveret som en skræddersyet opgave, der anvender eksisterende data om kommuners og kyststrækningers positioner i Danmark. Derudover blev der anvendt data fra Danmarks Adresseregister (DAR) og Danmarks Statistiks register over befolkningen (BEF).

En opgave som denne kan typisk leveres inden for to uger, efter at opgaven er blevet afklaret mellem Danmarks Datavindue og brugeren.

Case 2: Geografiske klynger

Baggrund

En bruger ønsker at foretage analyser baseret på befolkning i skoledistrikter over hele landet.

Proces

Brugeren indsender en GIS-fil (i et geografisk dataformat) med geografiske klynger i form af skoledistrikter (polygoner/områder). Dem kan man hente gratis fra et fælleskommunalt dataregister. Brugeren ønsker dem omsat til adresser, som kan kobles med registerdata via adresse-id’erne.

Et adresse-id eller en adressekode er en nøgle, som unikt udpeger en adresse enten i form af et husnummer (adgangs- eller opgangsadresse) eller en enhedsadresse (etageadresse). I praksis anvendes adressevariablen OPGIKOM, som sammen med KOM (kommunekode) entydigt udpeger adgangsadresser i Danmark. OPGIKOM består af vejkode og husnummer inkl. evt. bogstav.

OPGIKOM findes i andre af Danmarks Statistiks registre, hvorfor der kan kobles fra fx befolkningsregisteret (BEF) til disse skoledistrikter (via nøgleregisteret BEFADR).

Analysemuligheder

Man kan koble registerdata på tværs af registre vha. CPR-nummer og adresse-id, og man kan analysere på den geografiske udbredelse af analyseparametre vha. oplysning om klynger.

Rådgivning

Afklaringer af inputdatas kvalitet foregår, inden opgaven løses af Danmarks Datavindue, og der aftales en timeramme for opgaven/leverancen.

I de leverede skoledistrikter viste det sig, at der var små huller enkelte steder uden et registreret aktivt skoledistrikt. Der var også en hel del overlappende distrikter, da nogle skoledistrikter kan dække op til 6. klasse, andre alle klassetrin i grundskolen, eller kun 10. klasse. Disse dækker helt eller delvist det samme område.

Med til Danmarks Datavindues bearbejdning af de geografiske klynger hører også en kontrol af klyngernes størrelse, således at man sikrer, at ingen af distrikterne indeholder færre end 50 husstande (= beboede adresser). Hvis distrikterne er for små, overholder det ikke Danmarks Statistiks datafortrolighedspolitik.

Leveringstid

En opgave af denne art vil normalt kunne løses inden for en ramme af 10 timer. Opgaven kan leveres inden for to uger.

Alternative løsninger

Mange brugere benytter geografiske klynger baseret på kvadratnettet, hvor 100x100m celler er de mindste geografiske enheder, der kan tilknyttes registerdata. Kvadratnetceller bliver lagt sammen i de tyndt befolkede områder, så de opfylder størrelseskravet om 50 husstande. Danmarks Datavindue kan levere et sæt standardklynger baseret på kvadratnettet.

I princippet er der ingen begrænsninger for, hvilke distrikter brugeren kan anvende til at analysere på data, blot de overholder størrelseskravet på mindst 50 husstande. Hvis det ønskes at inddrage virksomhedsdata i kombination med geografiske klynger, gælder der andre størrelseskrav. Her fastsættes mindstestørrelsen i det konkrete projekt, og det afhænger af omfanget og detaljeringsgraden i virksomhedsdata, som indgår i analyserne.

Case 3: Afstandsberegning mellem bopæle og ungdomsuddannelser

Baggrund

En bruger vil gerne have målt afstanden fra unges bopæl til den ungdomsuddannelse, de går på eller har gået på inden for en afgrænset periode.

Proces

Brugeren uploader en fil indeholdende variablerne: By, adresse og region på både unges bopæle og ungdomsuddannelserne. Der laves et tjek af inputdatas kvalitet, og det aftales om afstandsberegningen skal være i fugleflugt eller i vejafstand fra en bopæl til en ungdomsuddannelse. Derefter aftales en timeramme for opgaven. Afhængigt af adressernes format, kan det være nødvendigt at foretage en form for adressevask, herunder med tilføjelse af koordinater, som er nødvendige for at kunne foretage afstandsberegning.

Når opgaven er færdig, leveres der en SAS-fil med data om bopælenes og institutionernes afidentificerede adresser, samt afstand i den ønskede enhed (meter, kilometer).

Leveringstid

En opgave af denne type vil typisk kræve mellem 15 og 30 timer, afhængigt af omfanget og den ønskede type afstand. En opgave, som beregner afstanden i fugleflugt, vil tage færre timer, end en opgave som beregner vejafstand. Ligeledes vil en opgave som omfatter en beregning af afstanden mellem alle bopæle og alle institutioner tage længere tid, end hvis beregningen begrænses til fx afstande mellem bopæle og institutioner i den samme region.

Opgaver med kvadratnetdata

Kvadratnetdata inddeler Danmark i faste celler baseret på koordinater. Det betyder, at inddelingen er konstant over tid, i modsætning til administrative opdelinger som kommuner eller sogne, der kan ændre sig. Danmarks Datavindue har kvadratnetdata på 100 meter celler, 1 kilometer celler og 10 kilometer celler, hvortil der er tilknyttet KOM og OPGIKOM (adresse11).

Som tommelfingerregel dækker kvadratnettet fra kommunesammenlægningen i 2007 og frem. Det kan også anvendes for tidligere år, men jo længere tilbage man går, desto færre adresser findes der i kvadratnetgrundlaget.

I Danmarks Datavindue tilbyder vi to muligheder for arbejde med kvadratnetdata:

  1. Levering af optælling af husstande og individer pr. kvadratnetcelle i perioden 1980-seneste tilgængelig data. Ud fra disse oplysninger kan man sammenlægge og danne klynger efter behov. Derefter udarbejder vi et datasæt med klyngekode, kommune og afidentificerede OPGIKOM.
  2. Levering af standardklynger. Ud fra kvadratnettets 100x100m-celler har Danmarks Datavindue udarbejdet standardklynger, som kan kobles til Danmarks Statistiks registerdata via KOM OPGIKOM. Disse klynger er dannet ud fra et princip om, at de skal være små, samtidig med at diskretioneringskravene er opfyldt for alle år i den tidsserie, som klyngerne kan bruges inden for. Klyngerne er derudover sammensat af kvadratnetceller efter et princip om nærhed og størrelse på befolkningen inden for klyngen. Det er naturligvis tilstræbt, at klyngerne er sammensat af kvadratnetceller, der er så nære, at de grænser op til hinanden. Der vil dog forekomme undtagelser, hvor klynger kan være sammensat af kvadratnetceller, der ikke grænser op til hinanden.

Særlige krav for diskretionering af geografiske data

Når der arbejdes med geografiske data på forskermaskinen, gælder der særlige krav til, hvordan data må anvendes og vises. For alle typer geografiske inddelinger, herunder klynger og kvadratnet, skal hver celle indeholde mindst 50 husstande i natbefolkningen pr. registerår.

Hvis et projekt anvender klynger eller celler på tværs af flere år, skal dette krav være opfyldt for hvert eneste registerår, også når der kommer nye opdaterede år til. Det kan indebære, at tidligere dataleverancer ikke længere må ligge på projektet, fordi de ikke opfylder reglerne, når nye år tilføjes.

Prisen for geodata-opgaver

Prisen for geodata-opgaver er varierende. Når vi modtager en henvendelse om en opgave, udarbejder vi en rammeaftale med et maksimalt forventet tidsforbrug, som afhænger af flere faktorer, herunder opgavens kompleksitet og kvaliteten af det modtagne data. Efter levering af opgaven afregner vi det reelle tidsforbrug. Se mere om vores prismodel under Priser og prisaftaler

Sådan kommer du i gang

Ønsker du hjælp til at løse en geodataopgave, skal du kontakte din DST-projektansvarlige og beskrive opgaven og data.