
Illustration: Granger, NYC / The Granger Collection
Midt i julestria i fjor kunngjorde Kunnskapsdepartementet «Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata«, med klare forventninger om at forskningsdata, finansiert av statlige midler, skal publiseres åpent for å gjenbrukes til alle formål.
Publisering av forskning har tradisjonelt sett vært forbeholdt forskningsresultater i form av artikler, antologier og monografier i mer eller mindre åpne kanaler. Men for å kunne publisere noe som helst trengs det et kunnskapsgrunnlag, enten man skaper sitt eget materiale eller bygger på andres.
Hvilke data skal deles og hvorfor?
For mange fagdisipliner er forskningsdata synonymt med såkalte kildedata, data som allerede finnes (offentlig statistikk, litteratur, kunst etc.). Disse dataene er det selvsagt ingen vits i å bruke tid på å republisere dersom de allerede er trygt oppbevart og tilgjengelige et eller annet sted der ute i verden.
Data du som forsker har generert i forbindelse med ditt forskningsprosjekt, såkalte resultatdata, skal derimot aller helst publiseres og deles med allmennheten. Årsakene til dette er mange og sammensatte, men noen av de viktigste er at bedre tilgang til, og mer gjenbruk av forskningsdata kan bidra til:
- Et større datagrunnlag for alle forskere
- Økt tillit til forskere og forskningsresultater
- Kvalitetssikring av tidligere funn
- Innovasjon og verdiskapning ved at andre aktører kan se nye bruksområder
- Å unngå at samme type datainnsamling finansieres flere ganger
- Å unngå gjentakelse av potensielt skadelige eksperimenter på mennesker, dyr og miljø
- Å unngå belastende eksperimenter ved datainnsamling på enkeltgrupper eller individer i samfunnet
Tre grunnprinsipper
Krav til publisering av forskningsdata er ikke egentlig noe nytt fenomen her til lands. Norges forskningsråd har hatt dette i sine kontrakter i en del år allerede. Grunnlaget for det første av tre grunnprinsipper i de nye retningslinjene ble lagt i EU sitt Horizon 2020-program:
«Research data should be made as open as possible, as closed as necessary».
Kongstanken er altså at forskningsdata skal publiseres så åpent som mulig. Så tas det forbehold om at det kan være nødvendig med hel eller delvis skjerming, eksempelvis med tanke på personvern, patenter eller forretningshemmeligheter. Datasett kan for eksempel publiseres på et senere tidspunkt for å ivareta disse hensynene.
I det andre grunnprinsippet heter det at «forskningsdata bør håndteres og tilrettelegges slik at verdiene i dataene kan utnyttes best mulig». Bakgrunnen for dette ligger blant annet i FAIR-prinsippet som sier at forskningsdata skal utstyres med metadata som gjør selve datasettene «Findable», «Accessible», «Interroperable» og «Reusable».
Det tredje grunnprinsippet overlater «beslutninger om arkivering og tilrettelegging av forskningsdata» til forskerfellesskapene og institusjonene. Tilgjengeliggjøring av forskningsdata for allmenn bruk kan i enkelte tilfeller være svært ressurskrevende, for eksempel med hensyn til anonymisering av større datasett eller utvikling av manualer for gjenbruk av kompliserte grunnlagsdata eller kode.
Datahåndteringsplan
Nytt er også statens forventninger om at institusjonene skal utvikle prosedyrer for godkjenning av datahåndteringsplaner. I en slik plan skal man beskrive hvordan forskningsdataene håndteres gjennom hele levetiden til et forskningsprosjekt, og formålet er å hjelpe forskere til å ta stilling til og vurdere ulike aspekt ved forskningsprosessen relatert til datasikkerhet, systematisering og klargjøring for publisering.
Som følge av de nye retningslinjene har Norges forskningsråd innført krav om godkjent datahåndteringsplan ved kontraktsinngåelse fra 2018 .
Har du spørsmål om håndtering av forskningsdata?
Se våre sider for mer informasjon, og ta gjerne kontakt med undertegnede (ifølge nettsidene så svarer jeg nemlig på alt om forskningsdata…)