Gå til sidens indhold

Statistisk behandling

Kontaktinfo

Forskning, teknologi og kultur, Erhvervsstatistik
Anne-Sofie Dam Bjørkman
39 17 33 96

asd@dst.dk

Hent som PDF

Forskning og udvikling i erhvervslivet

Statistikken er en årlig, spørgeskemabaseret undersøgelse, der er baseret på oplysninger indsamlet fra ca. 3.600 virksomheder. For 2022 indsamles oplysninger fra 3.545 virksomheder, der er udtrukket som en stikprøve blandt en population af ca. 20.000 virksomheder. Der gennemføres en omfattende kvalitetssikring af materialet, dels i Virk-blanketten, dvs., når respondenten indtaster de ønskede oplysninger, dels efterfølgende, hvor de indsamlede oplysninger gennemgås for usandsynlige værdier, der evt. rettes efter genkontakt til virksomhederne.

Kilder

Statistikken er en årlig, stikprøvebaseret spørgeskemaundersøgelse, der er baseret på oplysninger indsamlet fra ca. 3600 virksomheder. For 2022 indsamles oplysninger fra 3.545 virksomheder, der er udtrukket som en stikprøve fra en rammepopulation af ca. 20.000 virksomheder.

Dataindsamlingen for FoU og innovation i erhvervslivet gennemføres som én samlet dataindsamling i ét spørgeskema. For lige referenceår indsamles overordnede data om FoU udgifter og -personale samt køb af FoU-tjenester. For de ulige referenceår indsamles en fuld FoU-undersøgelse med detaljerede oplysninger om fx finansieringskilder.

Virksomhederne til stikprøven udvælges afhængigt af antallet af ansatte og branche. Udvalgssandsynligheden er 100 pct. blandt de største virksomheder (virksomheder med 100+ ansatte eller omsætning større 1 mia. kr.), og udvalgssandsynligheden er faldende i takt med at antallet af ansatte falder. For at sikre den samlede kvalitet af statistikken, har FoU-intensive brancher højere dækning end mindre FoU-intensive brancher. Virksomhederne i stikprøven er tilfældigt udvalgt.

Ud fra en bruttopopulation hentet fra Det Erhvervsstatistiske Register, ESR, dannes en undersøgelsespopulation (rammepopulation), hvor virksomheder i bestemte brancher eller med meget få ansatte (afhængigt af branche) er sorteret fra. Undersøgelsespopulationen er den population, der senere regnes op til og altså den population, som undersøgelsen beskriver. I 2022 består undersøgelsespopulationen af ca. 20.000 virksomheder.

Indsamlingshyppighed

Undersøgelsen foretages årligt. Antallet af variable varierer mellem lige årstal (kun overordnede variable) og ulige årstal (overordnede variable suppleret med detaljerede oplysninger).

Indsamlingsmetode

Statistikken er obligatorisk digital og indsamles via elektronisk spørgeskema på Virk

Datavalidering

Der gennemføres en omfattende fejlsøgning af materialet.

I blanketten er der indlagt automatisk fejlsøgning på en række variable. Det gælder fx summer. Svarer respondentens anførte sum ikke til summen af delkomponenterne, gøres respondenten opmærksom på dette, og kan rette i blanketten. Der gøres opmærksom på, hvis summen af delkomponenter fx skal være 100 pct., og den er over eller under dette niveau. Der er desuden indlagt oplysninger fra foregående års dataindsamlinger, og hvis de indtastede oplysninger varierer for meget i forhold til tidligere oplyste niveauer, bedes indberetter om at rette i værdien eller kommentere på udviklingen. Efterfølgende foretages en maskinel validering, hvor der foretages opretning med imputerede værdier.

Data behandles i en database, hvor der markeres for en række potentielle eller faktiske fejl. Prioritering af validering sker efter en score beregning, der beregnes for de enkelte virksomheder, efter hvilke fejl, der har størst betydning for den samlede statistiks kvalitet. I mange tilfælde genkontaktes virksomheder for at sikre, at beskrivelsen af virksomhedernes FoU-aktiviteter er retvisende og indsamlet efter samme model hvert år. Der foretages tests af ekstreme værdier på centrale variable/kombinationer af variable.

Enkelte af de indsamlede data sammenlignes med andre statistikker, for i tvivlstilfælde at vurdere om det indberettede med sandsynlighed kan være korrekt eller bør korrigeres. Det gælder fx antallet af FoU-årsværk, der sammenholdes med det samlede antal udførte årsværk i virksomheden, som det er registreret i det erhvervsstatistiske register (ESR). De samlede udgifter til innovation, herunder udgifter til egen FoU, sammenholdes med virksomhedens samlede omsætning, der også stammer fra ESR.

Som et led i den generelle kvalitetssikring er der udarbejdet en kvalitetshåndbog for statistikkerne om forskning, udvikling og innovation (FUI). Kvalitetshåndbogen kan findes på emnesiden for FoU.

Databehandling

Der er foretaget en stratificeret tilfældig udvælgelse af virksomheder efter antal fuldtidsansatte og branche. Ved opregning foretages vægtning og kalibrering af den enkelte virksomhed ud fra virksomhedens størrelse og branche.

Der foretages imputering af kritiske enheder. For kritiske virksomheder (fx. over en vis størrelse), som ikke har besvaret undersøgelsen, foretages imputering af besvarelsen – typisk via oplysninger, som virksomheden har givet til de foregående års undersøgelser. Andre virksomheder som ikke har besvaret spørgeskemaet (unit non-response) håndteres under opregningen.

Korrektion

Ikke relevant for denne statistik.