Gå til sidens indhold

Statistisk behandling

Kontaktinfo

Arbejde og Indkomst, Personstatistik
Pernille Stender
39 17 34 04

psd@dst.dk

Hent som PDF

Registerbaseret arbejdsstyrkestatistik (RAS)

Den registerbaserede arbejdsstyrkestatistik (RAS) er baseret på Arbejdsmarkedsregnskabet (AMR), som er et forløbsregister. Når RAS opgøres, foretages der en statusopgørelse (i forhold til befolkningens primære tilknytning til arbejdsmarkedet) den sidste arbejdsdag i november ud fra AMR. På baggrund af AMR er det dog også muligt at foretage statusopgørelser på vilkårlige dage i året, ligesom AMR kan anvendes til diverse forløbsanalyser mv.

Kilder

Fra og med offentliggørelsen d. 28. april 2015 er RAS baseret på Arbejdsmarkedsregnskabet (AMR). RAS er i den forbindelse revideret tilbage til november 2008. I samme forbindelse er dateringen af statistikken ændret, så der nu dateres efter referencetidspunktet ultimo november. Det betyder, at den seneste opgørelse hedder ultimo november 2022, hvor den tidligere ville have heddet 2023. Læs mere om Arbejdsmarkedsregnskabet. Grunddata i AMR stammer fra en række andre kilder:

  • eIndkomstregistret
  • det erhvervsstatistiske register
  • statistikken for offentligt forsørgede
  • uddannelsesstatistikken
  • indkomststatistikken
  • befolkningsstatistikken
  • barsels- og sygedagpengestatistikken
  • arbejdsklassifikationsmodulet

Før 2008 var grunddata for lønmodtagerne det centrale oplysningsseddelregister fra SKAT.

Indsamlingshyppighed

Statistikken er årlig.

Indsamlingsmetode

Indsamlingsmetoden består for det første af en særskilt bearbejdning af de enkelte kilderegistre. Efterfølgende foretages en tværgående databehandling (også kaldet en overlapsbehandling), hvor informationerne i de forskellige registre sammenholdes, og om nødvendigt rettes. Slutteligt samkøres med andre registre for at tilføje baggrundsoplysninger og danne populationen.

Datavalidering

Datagrundlaget for RAS har siden offentliggørelsen i april 2015 været Arbejdsmarkedsregnskabet (AMR). AMR udarbejdes både i en timenormeret og en ikke-timenormeret version. Det ikke-timenormerede AMR (AMR-UN) udgør datagrundlaget for RAS, og datavalideringen foregår således i produktionen af AMR_UN.

Ved produktionen af AMR foretages en omfattende datavalidering af de enkelte inputdata. Herunder er de vigtigste nævnt:

  1. Datakilden til oplysninger om lønmodtagerjobbene er eIndkomstregistret. Herfra hented oplysninger om, hvilket arbejdssted jobbet foregår på. Oplysningen om arbejdsstedet er grundlaget for oplysninger om branche, sektor og geografi. I nogle tilfælde er indberetningen fra arbejdsgiveren ikke korrekt, og der foretages derfor en fejlopretning. eIndkomstregistret har information om arbejdsfunktionskoden (DISCO_08) for lønmodtagere ansat i virksomheder, der er omfattet af lønstatistikken. Hvis virksomheden ikke er omfattet af lønstatistikken tilføres oplysningen om arbejdsfunktion fra Arbejdsklassifikationsmodulet , når informationen foreligger her.

  2. Datakilden til oplysninger om selvstændige er det erhvervsstatistiske register, indkomststatistikken, eIndkomstregistret og arbejdsløshedsstatistikken. Disse kilder valideres individuelt ved dannelsen af oplysningerne om selvstændige.

  3. Datakilden til oplysninger om fravær ved sygdom og barsel stammer fra barsels- og sygedagpengestatistikken. Data er bearbejdet en del bl.a. for at kunne give en foreløbig bestemmelse af, om fraværet er fra beskæftigelse eller ledighed.

Tværgående databehandling/datavalidering

Formålet med den tværgående databehandling/datavalidering er at slette, rette eller oprette arbejdsmarkedstilstande i tilfælde, hvor de forskellige datakilder ikke stemmer overens. Dette foregår ved en såkaldt overlapsbehandling. Reglerne, der anvendes, er komplekse, men de væsentligste overordnede områder er:

  • Selektion af job for selvstændige på baggrund af en række kriterier
  • Bestemmelse af om fravær grundet barsel/sygdom er fra beskæftigelse eller ledighed
  • Harmonisering af oplysninger om støttet beskæftigelse

Efterfølgende kobles oplysningerne til andre registre mv.

Databehandling

Databehandlingen i AMR foregår i flere trin. Første trin i databehandlingen er, at data fra forskellige kilder fejlsøges, bearbejdes og dernæst indlægges i en kildedatabase. Der indlægges data om offentligt forsørgede, lønmodtagere, selvstændige, medarbejdende ægtefæller, personer under uddannelse og modtagere af barsels- og sygedagpenge. Endvidere foretages der en imputering af betalte timer for selvstændige og medarbejdende ægtefæller. Derefter sker en overlapsbehandling af data, hvor 'ulovlige overlap' mellem arbejdsmarkedstilstande rettes, og koblinger mellem forskellige tilstande foretages.

Efter overlapsbehandlingen foretages en klassifikation af befolkningen ud fra de internationale retningslinjer fra ILO, som er beskrevet nærmere under Grupperinger og klassifikationer. Retningslinjerne består bl.a. af et sæt prioriteringsregler for, hvordan den primære tilknytning til arbejdsmarkedet bestemmes. Retningslinjerne siger, at beskæftigelse har højere prioritet end ledighed, mens ledighed har højere prioritet end tilstande uden for arbejdsstyrken. Herefter kobles til det erhvervsstatistiske register med henblik på at hente baggrundsoplysninger (branche, sektor, arbejdsstedskommune mv.) om de arbejdssteder, hvor de beskæftigede arbejder. Der kobles også til befolkningsstatistikken med henblik på at afgøre, hvorvidt personerne har bopæl i Danmark på refererencetidspunktet.

Efterfølgende dannes det såkaldte AMR-UN-register, som er et ikke-timenormeret forløbsregister med oplysninger om befolkningens tilknytning til arbejdsmarkedet, og som således udgør datagrundlaget for RAS. I RAS opgøres befolkningens tlknytning til arbejdsmarkedet ultimo november, men på baggrund af AMR-UN er det muligt at opgøre befolkningens tilknytning til arbejdsmarkedet på vilkårlige tidspunkter i årets løb.

AMR dannes også i en timenormeret variant (AMR-TN). Her har hele befolkningen altid en arbejdsmarkedstilknytning på 37 timer om ugen. Nogle af timerne kan fx være som beskæftiget, mens andre timer kan være uddannelse eller blot timer, hvor man ikke er tilknyttet nogen kendt socioøkonomisk kategori. Læs mere om statistisk behandling i AMR.

Korrektion

Der laves ikke korrektioner af data udover, hvad der allerede er beskrevet under datavalidering og databehandling.