Forskningsdata skal deles

Forskningsrådet krever åpen tilgang til forskningsdata. Svein Stølen leder en arbeidsgruppe som skal se på eksisterende praksis for lagring og deling av forskningsdata ved UiO.

INTERNASJONAL TREND: – Tilgjengeliggjøring av forskningsdata er en del av en internasjonal trend, påpeker Svein Stølen, prodekan ved Det matematisk-naturvitenskapelige fakultet.

Forskningsrådet har i høst vedtatt en ny policy for åpen tilgang til offentlig finansierte forskningsdata. Hovedprinsippet er at forskningsdata skal være tilgjengelige for relevante brukere, på like betingelser, til lavest mulig kostnad. Unntaket er datasett som kan true enkeltmenneskers eller nasjonal sikkerhet, strider mot regelverket for personvern eller andre juridiske bestemmelser samt, data som har kommersiell verdi. Data det er uforholdsmessig upraktisk eller kostbart å gjøre tilgjengelige, kan også unntas fra det generelle prinsippet om åpen tilgang.

Ved å legge til rette for bevaring og deling av forskningsdata, ønsker Forskningsrådet å bidra til bedre forskning, større gjennomsiktighet, mer samarbeid, større innovasjon og bedre utnyttelse av offentlige midler.

Nasjonal satsing

Finansieringsordningen Nasjonal satsing på forskningsinfrastruktur, som har søknadsfrist 15. oktober, er et av verktøyene Forskningsrådet vil bruke til å etablere infrastrukturer for datalagring og datahåndtering.

Nasjonal satsing på forskningsinfrastruktur har en ramme på 600 til 800 millioner. Ved tildeling av midler vil Forskningsrådet i tillegg til å prioritere søknader relatert til internasjonalt samarbeid om forskningsinfrastruktur, legge vekt på infrastruktur som bidrar til åpen tilgang til offentlig finansierte forskningsdata og sikring av viktige norske dataserier.

For infrastruktur som genererer større mengder data, krever Forskningsrådet dessuten at prosjektbeskrivelsen skal inneholde en plan for håndtering, lagring og tilgjengeliggjøring av data.

Helomvending

Janne Bondi Johannessen leder Tekstlaboratoriet ved Institutt for lingvistiske og nordiske studier. Hun leder også prosjektet Language Infrastructure made Accessible (LIA), som i 2013 fikk 27,3 millioner kroner fra Norges Forskningsråd til å bygge opp databaser med talemålsopptak av norsk og samisk språk.

Bondi Johannessen er svært glad for Forskningsrådets nye policy.

– Det er ikke så mange år siden Forskningsrådet la fram motsatt strategi. Også vårt eget institutt oppfordret oss til å selge så mye som mulig, noe som medførte mye arbeid til liten fortjeneste, kommenterer hun, og legger til at hun håper Forskningsrådets nye strategi også vil få konsekvenser for eksisterende forskningsmateriale og forskningsstruktur.

– Det er også viktig at vi bruker ressurser på å gjøre forskerne kjent med infrastrukturen som finnes, slik at de kan dra nytte av den, og vi må være åpne for at den kan benyttes i undervisning og i forskeropplæring.

Det meste av materialet til Tekstlaboratoriet og LIA er allerede tilgjengelig.

– Å gjøre forskningsdata og forskningsinfrastruktur tilgjengelig, er det viktigste vi kan gjøre for at forskningen på norsk og samisk språk skal bli så god som mulig, sier hun.

Balansegang

Også solforsker og instituttleder ved Institutt for teoretisk astrofysikk Viggo Hansteen er positiv til de nye retningslinjene, men han ser også utfordringer.

– Det er viktig at data lagres i et format som er lesbart for alle. Metadata, dvs. merkelapper som forteller hva de forskjellige datasett inneholder, er også viktig, poengterer han.

Hansteen peker på at lagring og deling av forskningsdata ofte er et spørsmål om ressurser. Instituttet er i dag vertskap for databasen til den japanske solsatellitten Hinode. Å sette opp og drifte denne databasen krever to stillinger i to til tre år.

Hvilke data det er hensiktsmessig å lagre, og hvor lenge data skal lagres, er også spørsmål det er viktig å diskutere.

– Innenfor mitt felt som er solfysikk, tar vi 30 bilder i sekundet. For å få best mulig kvalitet, kombinerer vi flere bilder, og vi generer flere terrabyte med bildedata hver eneste dag. For andre forskere er det de sammensatte bildene som vil være interessante, mener han.

Numeriske simuleringer, dvs. simuleringer hvor forskerne etterligner virkeligheten ved hjelp av datamaskiner, er et annet felt som genererer enorme datamengder, data som instituttet i dag sletter fortløpende for å gi plass til nye simuleringer.

– Det handler om å finne en balansegang. Så lenge de byråkratiske kravene ikke krever uforholdsmessig store ressurser, er åpent tilgjengelige data noe vi alle drar nytte av.

Skal kartlegge UiO

I sin nye policy oppfordrer Forskningsrådet forskningsinstitusjonene til å utforme egne retningslinjer.

Svein Stølen, prodekan ved Det matematisk-naturvitenskapelige fakultet, leder en arbeidsgruppe som skal se på lagring og deling av forskningsdata ved UiO.

– Gir vi flere tilgang til helheten, vil flere kunne etterprøve forskningsresultater. Forskere vil kunne koble eksisterende data med egne data, og vi vil i større grad kunne unngå duplisering av forskning, dvs. at forskere gjør det samme, påpeker han.

Gruppen skal i første omgang kartlegge eksisterende praksis. Gruppen skal også anbefale løsninger og lage forslag til prinsipper og retningslinjer som ivaretar de vitenskapelige ansattes rettigheter.

Ekstra utgiftspost

På spørsmål om hvorvidt Forskningsrådets nye policy også skal gjelde eldre materiale, svarer Stølen at det er viktig å tenke praktisk. I første omgang må vi se på forskningen vi gjør i dag.

Hvordan unntaksreglene skal iverksettes, er et annet spørsmål arbeidsgruppen vil se nærmere på.

– Data som har kommersiell verdi, vil vi ofte finne i prosjekter som finansieres og eies av næringslivet, men dette kan også gjelde offentlig finansierte prosjekter. Kunnskapsdepartementet oppfordrer oss til å innovere. Er målet å patentere, kan det for eksempel være aktuelt å vente med å gjøre dataene tilgjengelige til patentprosessen er kommet tilstrekkelig langt, bemerker han.

Svein Stølen ser også utfordringer knyttet til kreditering, og ikke minst til kostnadene med å følge opp Forskningsrådets anbefalte retningslinjer.

– Hvor mye dette vil kreve av den enkelte forsker, vil variere, men det er ikke tvil om at Forskningsrådets nye policy kommer til å bli en utgiftspost for universitetet. Totalt sett vil dette på sikt likevel bety en mer effektiv utnyttelse av ressursene, understreker han.

 

 

Av Grethe Tidemann
Publisert 13. okt. 2014 05:00
Legg til kommentar

Logg inn for å kommentere

Ikkje UiO- eller Feide-brukar?
Opprett ein WebID-brukar for å kommentere