Danmarks Statistik Logo
Vejviser i statistikpilDokumentation af statistikpilVaredeklarationerpilTværgående produkterpilIDA-databasen
Varedeklaration: IDA-databasen

Henvendelse:
Forskning og Metode
Charlotte Leolnar Reif
39 17 32 32
e-post: clr@dst.dk

Søren Leth-Sørensen
89 42 68 10
e-post: sls@dst.dk

0 Administrative oplysninger om statistikproduktet
1 Indhold
2 Tid
3 Pålidelighed og usikkerhed
4 Sammenlignelighed
5 Tilgængelighed
6 Supplerende dokumentation




0 Administrative oplysninger om statistikproduktet


0.1 Navn
IDA-databasen

0.2 Emnegruppe
Tværgående produkter

0.3 Ansvarlig myndighed, kontor, person m.v.
Forskning og Metode
Charlotte Leolnar Reif, tlf. 39 17 32 32, e-post: clr@dst.dk
Søren Leth-Sørensen, tlf. 89 42 68 10, e-post: sls@dst.dk

0.4 Formål og historie
Formålet med den Integrerede Database for Arbejdsmarkedsforskning (IDA-databasen) er at stille et datamateriale om personer og arbejdssteder til rådighed på individniveau. Oplysningerne i databasen kan anvendes til at belyse en lang række problemstillinger vedrørende arbejdsmarkedet (fx personers mobilitet, virksomheders jobskabelse samt samspillet mellem person og virksomhed).
IDA-databasen blev udviklet i årene 1988-90. Udviklingen blev finansieret af Statens Samfundsvidenskabelige Forskningsråd (SSF) og Danmarks Statistik. IDA-databasen har primært et forskningsmæssigt sigte, men kan også benyttes til andre formål.

IDA-projektet blev udført af en projektgruppe bestående af:
Ruth Emerek, cand.stat., lektor ved Aalborg Universitet
Per Vejrup-Hansen, cand.polit., lektor ved Handelshøjskolen i København
Søren Leth-Sørensen, mag.scient.soc., specialkonsulent i Danmarks Statistik.

0.5 Brugere og anvendelsesområder
Databasen er oprindeligt opbygget med specielt henblik på at betjene forskere, men offentlige myndigheder (ministerier) og interesseorganisationer anvender også hyppigt databasen.

Det særlige ved databasen er, at man kan koble personer og virksomheder sammen. Derfor kan personer karakteriseres på grundlag af oplysninger om den virksomhed, de er ansat i og tilsvarende kan man beskrive virksomhederne på grundlag af oplysninger om de ansatte. Der findes mere end 200 variabler i databasen, herunder en lang række baggrundsvariabler om personer. Desuden er det muligt at følge både personer og virksomheder over tid.

Databasen indeholder oplysninger om samtlige personer i befolkningen og alle virksomheder med ansatte, hvilket gør den velegnet til at belyse problemstillinger, der vedrører udsnit af forholdsvis små grupper.

0.6 Kilder
Datagrundlaget for IDA er en række statistikregistre i Danmarks Statistik. Nedenstående registre indgår alle i udarbejdelsen af IDA i perioden 1980-2003. Fra og med 2004 indgår oplysninger fra Udannelsesstatistikregistret (UKM) ikke i IDA længere. Enkelte uddannelsesvariable ophører dog tidligere end dette. Oplysninger fra Danmarks Statistiks Arbejdsklassifikantionsmodul (AKM) indgår ligelede ikke fra og med 2004.

Der henvises til Times og Højkvalitetsdokumentation for oplysninger om de enkelte variable.
  • Det Centrale Oplysningsseddelregister (COR) fra Told- og Skattestyrelsen
  • Danmarks Statistiks Befolkningsstatistikregister
  • Udannelsesstatistikregistret (UKM)
  • Danmarks Statistiks Arbejdsklassifikationsmodul (AKM)
  • Indkomststatistikregistret
  • Erhvervsbeskæftigelsen
  • Registerbaseret arbejdsstyrkestatistik (RAS)
  • Danmarks Statistiks Arbejdsløshedsstatistikregister

Det Centrale Oplysningsseddelregister (COR) fra Told- og Skattestyrelsen
Oplysningsseddelregisteret bygger på de oplysninger, der skal indsendes til skattemyndighederne af arbejdsgivere og andre, der udbetaler løn, vederlag, pension eller lignende. Oplysningssedlerne indeholder for hvert enkelt ansættelsesforhold oplysninger om bl.a. størrelsen og arten af indkomsten, størrelsen af ATP-bidraget og om hvilket beløb, der indeholdes i A-skat. Oplysningsseddelregisteret giver således mulighed for, at opdele A-indkomsten på forskellige indkomstarter, fx. løn, arbejdsløshedsdagpenge og sociale pensioner. Oplysningssedlerne giver koblingen mellem den enkelte arbejdstager og arbejdsstedet.

Danmarks Statistiks Befolkningsstatistikregister
Befolkningsstatistikregisteret indeholder grundlæggende demografiske oplysninger om hele landets befolkning. Registerets grundlag er det Centrale Personregister (CPR).

Udannelsesstatistikregistret (UKM)
UKM indeholder oplysninger om befolkningens uddannelsesmæssige baggrund. Registret klassificerer personer efter igangværende uddannelse, senest afsluttede almenuddannelse og højeste afsluttede erhvervsrettede uddannelse.

Danmarks Statistiks Arbejdsklassifikationsmodul (AKM)
AKM indeholder oplysninger om erhvervs- og beskæftigelsesforhold for den skattepligtige del af befolkningen. I registeret tildeles hver enkelt person erhvervs- og stillingskoder for den væsentligste beskæftigelse i løbet af et kalenderår på grundlag af oplysninger fra en lang række registre.

Indkomststatistikregistret
Registret indeholder oplysninger om befolkningenes indkomst-, fradrags-, formue- og skatteforhold.

Erhvervsbeskæftigelsen
Registret indeholder oplysninger om antal arbejdssteder og antal beskæftigelsesforhold ultimo november med branchemæssige og regionale fordelinger.

Registerbaseret arbejdsstyrkestatistik (RAS)
Registeret indeholder oplysninger om befolkningens tilknytning til arbejdsmarkedet på et bestemt tidspunkt, nemlig ultimo november måned. For de beskæftigede er der tilknyttet oplysninger om bopæls- og arbejdsstedskommune som anvendes i pendlingsstatistikken.

Danmarks Statistiks Arbejdsløshedsstatistikregister
Registeret indeholder oplysninger om personer, der er eller har været medlem af en statsanerkendt arbejdsløshedskasse samt andre personer, der er eller har været tilmeldt et offentligt arbejdsformidlingskontor som arbejdssøgende. I registeret findes der bl.a. oplysninger om ledighedgrad på ugebasis. Arbejdsløsheden opgøres på grundlag af Arbejdsmarkedsstyrelsens Centrale Register for Arbejdsmarkedsstatistik, CRAM.

Læs evt. mere om registrene i andre varedeklarationer og i udgivelsen: Poulsen, Marius E. m.fl. (red). Personstatistik i Danmark - Et personbaseret statistiksystem. Kbh.: Danmarks Statistik, 1994.

0.7 Indsamlingshjemmel
Lov om Danmarks Statistik

0.8 Indberetningsbyrde
Ingen

0.9 EU-regulering
Ingen


1 Indhold


1.1 Indholdsbeskrivelse
IDA-databasen indeholder oplysninger om befolkningens tilknytning til arbejdsmarkedet samt om arbejdssteder og firmaer. I IDA kobles personer og virksomheder sammen. Personer kan derfor karakteriseres via oplysninger om den virksomhed, de er ansat i, og tilsvarende kan man beskrive virksomhederne via oplysninger om de ansatte. Der findes godt 100 variable i databasen. Det er muligt at følge både personer og virksomheder over tid, således at databasen kan anvendes til at belyse problemstillinger, der kræver data for en række år. Variablene er, så vidt det har været muligt, kodet på samme måde alle år, så oplysningerne kan sammenlignes.

IDA indeholder oplysninger om samtlige personer i befolkningen(5,3 mio) og alle virksomheder med ansatte (ca. 230.000). IDA er baseret på registeroplysninger. Der anvendes data fra en række registre, herunder fra ét som indeholder oplysninger om ansættelser i løbet af året, og som derved giver koblingen mellem personer og arbejdssteder. Arbejdsstederne kan skifte identifikationsnummer ved ejerskifte eller blot af interne administrative årsager. Hvis man ikke korrigerer for dette, vil der ske et for stort antal nedlæggelser og oprettelser af arbejdssteder. Dette identitetsproblem er i IDA løst ved at opstille en række krav for, hvornår der er tale om det samme arbejdssted fra et år til det næste.

Samme arbejdssted foreligger, hvis én af følgende regler er opfyldt:
Samme ejer og samme branche
Samme ejer og samme arbejdsstyrke
Samme arbejdsstyrke og samme adresse eller branche

Både personer og arbejdssteder kan følges årligt fra 1980 og fremefter. Oplysningerne er på individniveau.

1.2 Statistiske begreber
Databasen er opbygget som en relationsdatabase. I perioden 1980-2003 består den af 12 datasæt med 12 forskellige populationer:

Populationer og enheder i de 12 datasæt.
1A Persondatasættet.
Populationen er hele befolkningen opgjort pr. 1.januar. Enheden er personer.

1B Personændringer.
Populationen er foreningsmængden af befolkningen pr. 1.januar i to på hinanden følgende år. Det vil sige at populationen i et givet år er befolkningen pr. 1. januar samt personer, der er døde eller udvandrede i det forløbne år. Enheden er personer.

2A Hovedbeskæftigede lønmodtagere.
Populationen er de hovedbeskæftigede lønmodtagere, hvis vigtigste tilknytning til arbejdsmarkedet pr. ultimo november er som lønmodtagere. Enheden er ansættelsen.

2B Bibeskæftigede lønmodtagere.
Populationen er personer, hvis næstvigtigste tilknytning til arbejdsmarkedet pr. ultimo november er som lønmodtagere. Der er altså tale om et bijob ved siden af en vigtigste tilknytning som enten lønmodtager, arbejdsgiver, selvstændig eller medhjælpende ægtefælle (dvs. at personen tillige findes i et af de øvrige datasæt vedrørende ansættelser/beskæftigede, 2A, 2C, 2F eller 2G). Populationen omfatter også personer, hvis vigtigste tilknytning til arbejdsmarkedet er som efterlønsmodtagere og personer på overgangsydelse med (begrænset) erhvervsmæssig beskæftigelse. Enheden er ansættelsen.

2C Arbejdsgivere.
Populationen er personer, der er ejere (eller medejere) af en virksomhed, hvor der er mindst én lønmodtager ansat (som hoved- eller bibeskæftiget) pr. ultimo november. Denne placering som arbejdsgiver betragtes som personens vigtigste tilknytning til arbejdsmarkedet. Enheden er "ansættelsen".

2C Tilgangspersoner.
Populationen er den del af de hovedbeskæftigede lønmodtagere og arbejdsgivere, der er "nyansatte" på et arbejdssted pr. ultimo november i det pågældende år, dvs. som ikke var ansat på arbejdsstedet ultimo november året før.
Populationen er således en delpopulation af populationerne i datasættene 2A og 2C. Enheden er ansættelsen.

2E Afgangspersoner.
Populationen er den del af de hovedbeskæftigede lønmodtagere og arbejdsgivere, der i løbet af den følgende årsperiode afgår fra det arbejdssted, hvor de er ansat pr. ultimo november i det pågældende år - dvs. at de ikke genfindes på arbejdsstedet ultimo november året efter. Populationen er således en delpopulation af populationerne i datasættene 2A og 2C. Enheden er ansættelsen.

2F Selvstændige.
Populationen er personer med selvstændig virksomhed, som ikke har ansatte pr. ultimo november i det pågældende år, og hvor der er tale om personens vigtigste tilknytning til arbejdsmarkedet. Der kan forekomme beskæftigelse af lønnet personale i løbet af året uden for registreringsugen i november. Enheden er "ansættelsen".

2G Medarbejdende ægtefæller.
Populationen er personer, der har deres væsentligste indkomst i løbet af året som medarbejdende ægtefælle, og som er gift med en person, der er arbejdsgiver eller selvstændig. Enheden er ansættelsen.

3A Arbejdssteder.
Datasættet omfatter de erhvervsenheder, der i årets løb har haft lønnet personale beskæftiget, og for hvilke der er indbetalt kildeskat. Arbejdsstedet er den enkelte (lokale) erhvervsenhed, som organisatorisk, geografisk og branchemæssigt er sammenhængende.
Der er tale om en "bruttopopulation" af arbejdssteder for et helt kalenderår, som også omfatter arbejdssteder, der ikke har ansatte pr. ultimo november - fx på grund af sæsonpræget beskæftigelse, eller fordi arbejdsstedet kun eksisterer i en del af året (dvs. at det nedlægges før, eller oprettes efter, ultimo november).
En relevant delpopulation er således arbejdssteder med ansatte pr. ultimo november.
En anden relevant delpopulation kan være arbejdsste eder med hovedbeskæftigede pr. ultimo november - idet det kan forekomme, at der alene er tale om bibeskæftigede på arbejdsstedet.
Endelig kan man anvende forskellige delpopulationer af bevarede, nedlagte eller oprettede arbejdssteder. Enheden er arbejdsstedet.

3B Firmaer.
Ved et firma - en arbejdsgiverenhed - forstås i den private sektor den enhed, der indeholder og afregner kildeskat for de ansatte (SE-enheden). Et firma kan være en del af en "koncern", bestående af flere firmaer. I den statslige sektor er firmaenheden identisk med en styrelse, defineret ved hovedkonto i finansloven. I den kommunale sektor udgør hvert fysisk adskilt arbejdssted et firma. Et firma består af ét eller flere arbejdssteder. I tilfælde af, at et firma kun omfatter ét arbejdssted, er firmaenheden identisk med den tilsvarende arbejdsstedsenhed (i datasæt 3A vedrørende arbejdssteder). Enheden er firmaet.

3C Nedlagte arbejdssteder.
Datasættet omfatter "endeligt" nedlagte arbejdssteder i perioden efter 1980 og indtil ultimo det seneste år i databasen. Der er således tale om en kumulering af samtlige "endeligt" nedlagte arbejdssteder i hele perioden siden 1980.
Datasættet indeholder eksempelvis ikke enheder, der overgår fra arbejdssteder med ansatte pr. november til arbejdssteder uden ansatte pr. november. Enheden er arbejdsstedet.

Variabler
Da databasen indeholder mere end 200 variabler, er de ikke listet her. Overskrifterne for variabler i de tre vigtigste datasæt er:

Personer
  • Køn, alder mv.
  • Familie og husstand
  • Uddannelse
  • Beskæftigelse og erhvervserfaring
  • Arbejdsløshed
  • Indkomst

Ansættelser
  • Stilling, heltid/deltid
  • Timeløn
  • Anciennitet
  • Ændring i ansættelse: Tilgang/afgang

Arbejdssteder og firmaer
  • Oprettelsesår
  • Branche, beliggenhed mv.
  • Ansatte og lønniveau
  • Identitet over tid (bevaret, nedlagt, oprettet)

Fra og med 2004 udfases databasen til at bestå af 4 datasæt istedet for de ovenfor beskrevne 12 datasæt. Disse hedder:

Populationer og enheder i de 4 datasæt.
1 Personer
Populationen er hele befolkningen opgjort pr. 1.januar. Enheden er personer.

I dette datasæt er de tidligere populationer 1A og 1B indeholdt.

2. Ansættelser
Populationen er alle personer der har en ansættelse og derved en tilknytning til arbejdsmarkedet. Ansættelsesdatasættet indeholder alle typer af ansættelser såsom hovedbeskæftigede, bibeskæftigede lønmodtagere, arbejdsgivere, selvstændige og medarbejdende ægtefæller, øvrige novemberansættelser, ej-november og vigtigste november ansættelser. Enheden er ansættelsen.

I dette datasæt er de tidligere populationer 2A, 2B, 2C, 2D, 2E, 2F og 2G indeholdt.

3. Arbejdssteder
Populationen er det tidligere arbejdsstedsdatasæt inklusiv de nedlagte arbejdssteder. Enheden er arbejdsstedet.

I dette datasæt er de tidligere populationer 3A og 3C indeholdt.

4. Firmaer
Firmadatasættet er identisk med det tidligere firmadatasæt. Enhenden er firmaet.

I dette datasæt er de tidligere populationer 3B indeholdt.


Variabler
I forbindelse med udfasningen af IDA blev der skåret drastisk ned på antallet af variable. IDA indeholder således idag godt 100 variabler og kan fortsat grupperes ud fra de tre vigtigste datasæt:

Personer
  • Køn, alder mv.
  • Beskæftigelse og erhvervserfaring
  • Arbejdsløshed
  • Indkomst

Ansættelser
  • Stilling, heltid/deltid
  • Timeløn
  • Anciennitet
  • Ændring i ansættelse: Tilgang/afgang

Arbejdssteder og firmaer
  • Oprettelsesår
  • Bran nche, beliggenhed mv.
  • Ansatte og lønniveau
  • Identitet over tid (bevaret, nedlagt, oprettet)

For yderligere information om IDA henvises til Højkvalitetsdokumentation. Heri findes en beskrivelse af de fire datasæt samt dokumentation af alle variablerne i IDA.


2 Tid


2.1 Referencetid
Hovedparten af oplysningerne i IDA refererer til et bestemt tidspunkt i året - der er med andre ord primært tale om årlige statusoplysninger.
Sammenkædningen af personer og arbejdssteder i det enkelte år via Det Centrale Oplysningsseddelregister refererer til ultimo november måned. Dette tidspunkt er valgt således, at det ligger tæt på slutningen af året, samtidig med, at registreringen ikke bliver forstyrret af sæsonmæssige forhold (lukning af virksomheder omkring julen). Det betyder, at opgørelser af ansættelser i den enkelte virksomhed refererer til situationen pr. ultimo november.
Baggrundsoplysninger vedrørende de enkelte personer refererer derimod hovedsageligt til ultimo året. En undtagelse herfra er oplysninger om personers uddannelsesmæssige status, der refererer til oktober måned.
Befolkningen er opgjort pr. 31.12. Befolkningen i IDA er i et givet år identisk med den CPR-baserede opgørelse af den samlede befolkning pr. 1. januar det følgende år - fx er oplysninger i 1980 således baseret på befolkningen pr. 31.12.1980/01.01.1981.

2.2 Udgivelsestid
Databasen opdateres hvert år. Målet er, at IDA er opdateret 3 måneder efter at RAS er færdigopdateret. Den er nu (marts 2009) opdateret til og med 2006.

2.3 Punktlighed
I 1998 og 1999 var opdateringen færdig primo juli. I 2000 var opdateringen færdig medio maj. I 2008 var opdateringen færdig i september. Punktligheden afhænger af hvor mange og hvilke ændringer, der er lavet i de registre, der indgår i databasen.

2.4 Hyppighed
Databasen opdateres hvert år.


3 Pålidelighed og usikkerhed


3.1 Samlet pålidelighed
Pålideligheden afhænger af pålideligheden af de enkelte donorregistre - se derfor i beskrivelsen af disse registre. Pålideligheden er høj på en meget stor del af databasen.

3.2 Usikkerhedskilder
Usikkerheden afhænger af usikkerheden af de enkelte donorregistre - se derfor i beskrivelsen af disse registre.

3.3 Tal for usikkerhed
Usikkerheden afhænger af usikkerheden af de enkelte donorregistre - se derfor i beskrivelsen af disse registre.


4 Sammenlignelighed


4.1 Sammenlignelighed over tid
Databasen er longitudinal - det vil sige at enhederne kan følges over tid. Det er derfor meget vigtigt at variablerne er sammenlignelige over tid.

Efter indførelsen af DISCO 88 er der sammenligningsproblemer med hensyn til stillingsbetegnelser over tid. Der er således et brud i 1996 (1991).

4.2 Sammenlignelighed med anden statistik
Databasen er sammelignelig med den Registerbaserede arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen, Indkomststatistikregistret, Arbejdsløshedsstatistikregistret og Befolkningsstatistikregistret.

I forhold til Erhvervsbeskæftigelsen varierer antallet af arbejdssteder. I Erhvervsbeskæftigelsen opgøres antal registrerede arbejdssteder og job pr. ultimo november. I IDA opgøres antallet af arbejdssteder som de erhvervsenheder, der i årets løb har haft lønnet personale beskæftiget, og for hvilke der er indbetalt kildeskat. Arbejdsstedet er den enkelte (lokale) erhvervsenhed, som organisatorisk, geografisk og branchemæssigt er sammenhængende. I IDA indgår således også arbejdssteder der har IKKE har ansatte pr. ultimo november men som har ansatte i løbet af året, som følge af sæsonpræget beskæftigelse, eller fordi arbejdsstedet kun eksisterer i en del af året (dvs. at det nedlægges før, eller oprettes efter, ultimo november).
Ovensteående medfører, at antallet af arbejdssteder er færre i IDA i forhold til Erhvervsbeskæftigelsen.

4.3 Forhold mellem foreløbige og endelige tal
Der er kun endelige tal i databasen.


5 Tilgængelighed


5.1 Distributionskanaler
Dataudtræk fra IDA kan mod betaling stilles til rådighed for forskere i forskerplaceringsordningen. Data vil være anonymiseret (dvs. personnummer, adresse, arbejdsgivernummer, mv. er erstattet af et neutralt løbenummer på en sådan måde, at det stadig er muligt at følge personer og arbejdssteder over tid). Til trods for anonymiseringen vil datudtræk fra IDA stadig være omfattet af Danmarks Statistiks regler vedrørende diskretion og datasikkerhed - der er fortsat tale om individoplysninger.
Det betyder bl.a., at udtrækket ikke må anvendes udenfor Danmarks Statistik.
Danmarks Statistik har udgivet en særlig publikation, som gennemgår, hvordan forskere får adgang til data i Danmarks Statistik. Publikationen: Data til forskningsprojekter - en vejledning for forskere kan rekvireres fra Danmarks Statistiks kontor for Forskning og Metode. Publikationen kan desuden findes på Internettet under adressen www.dst.dk.
Såfremt en forsker udelukkende har brug for specialfremstillede tabeller eller beregninger på basis af IDA-databasen, kan opgaven løses af Danmarks Statistik efter tilbud til en fast pris.

5.2 Grundmateriale: Lagring og anvendelsesmuligheder
Grundmaterialet (som jo er selve databasen) opbevares i registerform på individniveau.

5.3 Dokumentation
Fuld dokumentation foreligger i TIMES 3. På Danmarks Statistiks hjemmeside under Forskningsservice ligger endvidere et link til Højkvaltietsdokuemntation som er en dybdegående dokumentation af udvalgte vairable. Her forefindes i løbet af 2009 alle de variable der indgår i den offentliggjorte IDA fra og med 2004.

5.4 Øvrige oplysninger
En udførlig beskrivelse af databasen findes i "IDA- en integreret database for arbejdsmarkedsforskning" (Danmarks Statistik, 1991).
Der findes desuden 5 arbejdsnotater udarbejdet i forbindelse med opbygningen af IDA.


6. Supplerende dokumentation
Til denne varedeklaration findes ingen supplerende dokumentation





Emneord
A - Å (Efter emneord)

Sitemap
Sitemap

Print
Print

Højtaler / Loudspeaker ikon til angivelse af læs højt
Læs op

RSS ikon
RSS

Edag 2
Sikker e-post

English
English version
  Mindre skrifttype   Større skrifttype
Om denne side
Siden er senest redigeret:
5. august 2010
  Danmarks Statistik - Sejrøgade 11 - 2100 København Ø - - Tlf. 39 17 39 17 Privatlivspolitik