Statistisk behandling

Kontaktinfo

Arbejde og Indkomst, Personstatistik
Pernille Stender
24 92 12 33

Hent som PDF

Registerbaseret arbejdsstyrkestatistik (RAS)

Den registerbaserede arbejdsstyrkestatistik (RAS) er baseret på Arbejdsmarkedsregnskabet (AMR_UN), som er et forløbsregister. Når RAS opgøres, foretages der en statusopgørelse (i forhold til befolkningens primære tilknytning til arbejdsmarkedet) den sidste arbejdsdag i november i AMR. På baggrund af AMR_UN er det også muligt at foretage statusopgørelser på vilkårlige dage i året.

Kilder

Fra og med offentliggørelsen d. 28. april 2015 er RAS baseret på Arbejdsmarkedsregnskabet (AMR_UN) som er et forløbsregister. RAS er i den forbindelse revideret tilbage til november 2008. I samme forbindelse er dateringen af statistikken ændret, så der nu dateres efter referencetidspunktet ultimo november. Det betyder, at den seneste opgørelse hedder ultimo november 2024, hvor den tidligere ville have heddet 2025. Læs mere om Arbejdsmarkedsregnskabet.

Data i AMR_UN stammer fra en række andre kilder:

eIndkomstregistret
det erhvervsstatistiske register
statistikken for offentligt forsørgede
uddannelsesstatistikken
indkomststatistikken
befolkningsstatistikken
barsels- og sygedagpengestatistikken
arbejdsklassifikationsmodulet

Før 2008 var grunddata for lønmodtagerne det centrale oplysningsseddelregister fra SKAT, og disse oplysninger var ikke forløbsbaserede.

Indsamlingshyppighed

Statistikken er årlig.

Indsamlingsmetode

Ved produktionen af Arbejdsmarkedsregnskabet (AMR_UN) sker der en indledningsvist databehandling af de enkelte datakilder i disse lagres i en kildedatabase. Efterfølgende foretages en tværgående databehandling (også kaldet en overlapsbehandling), hvor informationerne i de forskellige registre sammenholdes, og om nødvendigt rettes. Slutteligt samkøres med andre registre for at tilføje baggrundsoplysninger og foretage en klassifikation af hele befolkningen.

Datavalidering

Datagrundlaget for RAS har siden offentliggørelsen i april 2015 været Arbejdsmarkedsregnskabet (AMR). AMR udarbejdes både i en timenormeret og en ikke-timenormeret version. Det ikke-timenormerede AMR (AMR-UN) udgør datagrundlaget for RAS, og datavalideringen foregår således i produktionen af AMR_UN.

Ved produktionen af AMR er den vigtigst datavalidering følgende:

Datakilden til oplysninger om lønmodtagerjobbene er eIndkomstregistret. Herfra hentes oplysninger om, hvilket arbejdssted jobbet foregår på. Oplysningen om arbejdsstedet er grundlaget for oplysninger om branche, sektor og geografi. I nogle tilfælde er indberetningen fra arbejdsgiveren ikke korrekt, og der foretages derfor en fejlopretning. eIndkomstregistret har information om arbejdsfunktionskoden (DISCO_08) for lønmodtagere ansat i virksomheder, der er omfattet af lønstatistikken. Hvis virksomheden ikke er omfattet af lønstatistikken tilføres oplysningen om arbejdsfunktion fra Arbejdsklassifikationsmodulet, når informationen foreligger her.
Datakilden til oplysninger om selvstændige er det erhvervsstatistiske register, indkomststatistikken, eIndkomstregistret og arbejdsløshedsstatistikken. Disse kilder valideres individuelt ved dannelsen af oplysningerne om selvstændige.
Datakilden til oplysninger om fravær ved sygdom og barsel stammer fra barsels- og sygedagpengestatistikken. Data er bearbejdet bl.a. for at kunne give en foreløbig bestemmelse af, om fraværet er fra beskæftigelse eller ledighed.

Tværgående databehandling/datavalidering

Formålet med den tværgående databehandling/datavalidering er at slette, rette eller oprette arbejdsmarkedstilstande i tilfælde, hvor de forskellige datakilder ikke stemmer overens. Dette foregår ved en såkaldt overlapsbehandling. Reglerne, der anvendes, er komplekse, men de væsentligste overordnede områder er:

Selektion af job for selvstændige på baggrund af en række kriterier
Bestemmelse af om fravær grundet barsel/sygdom er fra beskæftigelse eller ledighed
Harmonisering af oplysninger om støttet beskæftigelse

Efterfølgende kobles oplysningerne til andre registre mv.

Databehandling

Databehandlingen i AMR foregår i flere trin. Første trin i databehandlingen er, at data fra forskellige kilder fejlsøges, bearbejdes og dernæst indlægges i en kildedatabase. Der indlægges data om offentligt forsørgede, lønmodtagere, selvstændige, medarbejdende ægtefæller, personer under uddannelse, modtagere af barsels- og sygedagpenge og pensionister. Endvidere foretages der en imputering af betalte timer for selvstændige og medarbejdende ægtefæller. I andet trin foretages en overlapsbehandling af data, hvor 'ulovlige overlap' mellem arbejdsmarkedstilstande rettes, og koblinger mellem forskellige tilstande foretages.

Efter overlapsbehandlingen foretages en klassifikation af befolkningen ud fra de internationale retningslinjer fra ILO, som er beskrevet nærmere under "Grupperinger og klassifikationer". Retningslinjerne består bl.a. af et sæt prioriteringsregler for, hvordan den primære tilknytning til arbejdsmarkedet bestemmes. Retningslinjerne siger, at beskæftigelse har højere prioritet end ledighed, mens ledighed har højere prioritet end tilstande uden for arbejdsstyrken. Herefter kobles til det erhvervsstatistiske register med henblik på at hente baggrundsoplysninger (branche, sektor, arbejdsstedskommune mv.) om de arbejdssteder, hvor de beskæftigede arbejder. Der kobles også til befolkningsstatistikken for at kunne danne den bosiddende population i Danmark. I den forbindelse foretages der også en imputering af den socioøkonomiske gruppe "øvrige uden for arbejdsstyrken" som er personer der er bosiddende i Danmark, men som ikke er i en kendt socioøkonomisk gruppe.

Efterfølgende dannes det såkaldte AMR-UN-register, som er et ikke-timenormeret forløbsregister med oplysninger om befolkningens tilknytning til arbejdsmarkedet, og som udgør datagrundlaget for RAS. I RAS opgøres befolkningens tilknytning til arbejdsmarkedet ultimo november, men på baggrund af AMR-UN er det muligt at opgøre befolkningens tilknytning til arbejdsmarkedet på vilkårlige tidspunkter i årets løb.

AMR dannes også i en timenormeret variant (AMR-TN). Her har hele befolkningen altid en arbejdsmarkedstilknytning på 37 timer om ugen. Nogle af timerne kan fx være som beskæftiget, mens andre timer kan være uddannelse eller blot timer, hvor man ikke er tilknyttet nogen kendt socioøkonomisk kategori. Læs mere om statistisk behandling i AMR.

Korrektion

Der laves ikke korrektioner af data udover, hvad der allerede er beskrevet under datavalidering og databehandling.

Indhold

Relevans