Nå skal også «vanskelige» forskningsdata bli FAIR

Forskere og teknikere ved UiO er i gang med å utvikle QUALI-FAIR, en tjeneste som skal legge til rette for lagring og gjenbruk av personidentifiserende og kontekstsensitive forskningsdata.

VIL GI UIO ET KONKURRANSEFORTRINN: Å få på plass gode systemer og prosedyrer for gjenbruk av data vil styrke UiOs posisjon innen nasjonal og internasjonal forskning, mener fra venstre Anne Schad Bergsaker, prosjektleder for FAIR@UiO, professor Kirsti Klette, faglig leder for QUALIFAIR og Maria Dikova seniorrådgiver ved Institutt for lærerutdanning og skoleforskning.

Foto: Ola Gamst Sæther

FAIR-prinsippene for forskningsdata ble formulert i 2016, og har blitt et internasjonalt anerkjent ideal. Akronymet står for Findable, Accessible, Interoperable og Reusable.

– At forskningsdata er FAIR, vil si at dataene er tilgjengelige, gjenfinnbare og gjenbrukbare, forklarer Anne Schad Bergsaker, senioringeniør i Universitetets senter for informasjonsteknologi (USIT) og leder for prosjektet Fair@UiO 

– Det betyr ikke at dataene nødvendigvis skal være åpne, men metadataene må være åpne, slik at dataene er gjenfinnbare, presiserer hun.

Bergsaker forklarer at begrepet interoperable blant annet innebærer at både data og metadata skal kunne håndteres maskinelt og bruke konsistente vokabularer.

– Det samles i dag inn store mengder data som ikke er tilgjengelig for bruk etter at prosjektene er avsluttet. I mange tilfeller handler det om at forskningsmiljøer verken har gode rutiner eller gode verktøy for lagring og gjenbruk av data, påpeker Bergsaker.

– Ofte er begrunnelsen at det dreier seg om personidentifiserende og kontekstsensitive data, eller det kan handle om copyrights og andre former for rettighetsproblematikk.

En hub for vanskelige data

– EU stiller krav om open access til flest mulig data, men i praksis ser vi at forskere som samler inn persongjenkjennende data, ofte får unntak fra dette kravet.  Vi ser også at forskerne får mye informasjon om prinsippene for FAIR, men lite informasjon om hvordan forskningsdata kan gjøres FAIR, supplerer professor ved Institutt for lærerutdanning og skoleforskning (ILS) Kirsti Klette.

Klette som også er leder for Quality in Nordic Teaching QUINT, et nordisk senter for fremragende forskning, fikk i oktober tilslag på en søknad om støtte til å bygge opp QUALI-FAIR, en hub (klynge) som skal legge til rette for lagring og gjenbruk av det forskerne gjerne omtaler som vanskelige data.

–  Det handler om ulike typer sammensatte kontekstavhengige og eller persongjenkjennende data. Årsaken til at vi har valgt å kalle huben for QUALI-FAIR er for enkelthets skyld og fordi det ofte dreier seg om ulike typer kvalitative data som tekstdata, billeddata, videodata og biodata, kommenterer Klette.

UiOs kompetanse-hub'er for IT i forskning

Qualifair er et ledd i UiOs satsing på E-Infrastruktur.  På UiO er det etablert flere kompetanse-hub'er for IT i forskning. Disse er en del av UiOs satsing på å bygge opp hub-node-strukturer som skal  sørge for effektiv utnyttelse av ressurser, kunnskapsutvikling og kompetanseoverføring mellom ulike deler av UiO, samt sikre tilgang til e-Infrastrukturelle ressurser som leveres av USIT og den nasjonale e-Infrastrukturen.

Kostbare data som egner seg for gjenbruk

Som leder for QUINT og flere andre store prosjekter har Klette opparbeidet betydelig erfaring med gjenbruk og flerbruk av persongjenkjennende data. Primært dreier det seg om store mengder videofilm fra klasseromsundervisning i Norge og Norden.

– Dette er data som er kostbare og ressurskrevende å samle inn og som i stor grad egner seg for gjenbruk, men hvor det samtidig er viktig at personvernet blir ivaretatt, understreker hun.

Videofilmene lagres via Teaching Learning Videolab som ble etablert ved ILS i 2008. Erfaringene med utvikling av Teaching Learning Videolab var ifølge Klette en viktig forutsetning da ILS ble vertsinstitutt for QUINT.

' Les mer om QUINT i Uniforum:   Utdanningskvalitet i Norden: Hvorfor er det mer diskusjon i danske klasserom?

– I Teaching Learning Videolab har vi samarbeidet tett med Norsk senter for forskningsdata (NSD) i fem år om utvikling av en infrastruktur for lagring av bilde- og videodata som ivaretar hensynet til personvern. Vi har det siste året også samarbeidet tett med FAIR@UiO om utvikling av tekniske løsninger, forteller hun.

På spørsmål om forholdet mellom QUALI-FAIR og NSD, sier Klette:

– NSDs er primært en arkivfunksjon for HUMSAM-data, men dette dekker ikke persongjenkjennende data, og tjenesten er ikke oppdatert for det vi gjerne omtaler som vanskelige data. På sikt vil det imidlertid være naturlig at vi også trekker NSD inn i arbeidet med QUALI-FAIR.

Viktig å tenke gjenbruk helt fra prosjektstart

Mens de rundt 80 forskerne i det nordiske senteret har fri tilgang til materialet ved bruk av en gradert tilgangsportal, må forskere utenfra be om tillatelse, såkalt ‘access upon request’.  

– Sentralt for gjenbruk og flerbruk av data er selvfølgelig samtykkene man innhentet i første runde. Derfor er det viktig å tenke gjenbruk og flerbruk helt fra prosjektstart, understreker Klette.

Hun forteller at forskerne i QUINT bruker et felles skjema for samtykke hvor foreldre og lærere for eksempel har godkjent at materialet kan brukes i komparativ skoleforskning i Norden, men også i utdanning og etterutdanning av lærere i de samme land.

– I QUINT har vi har laget en infrastruktur for deling av videodata som ivaretar personvern men også forskernes behov, konstaterer hun.

Data fra ulike fagfelt

Mens dataene som er blitt samlet inn av forskerne i QUINT, primært skal brukes i forskning på undervisning, vil QUALI FAIR inkludere data fra en rekke forskningsfelt. Klette nevner billed- og videodata, lydopptak og ulike typer tekstbaserte data, i tillegg til biomedisinske og andre typer medisinske data.

Med seg i prosjektgruppa har Klette rundt tretti vitenskapelige og teknisk-administrative tilsatte fra høyst ulike disipliner ved UiO. Seks fakulteter og tolv institutter er representert i prosjektgruppa, i tillegg til Anne Bergsaker fra USIT og to representanter fra henholdsvis Digital Scholarship Center (DSC) og Spesialsamlingene ved Universitetsbiblioteket.

Kirsti Klette trekker fram antropologi som et eksempel på et fag hvor data i mindre grad er blitt gjort tilgjengelige for gjenbruk. Dette har både praktiske og etiske årsaker, mener hun.

– Ute i felten er notatblokken fortsatt et viktig verktøy, og data er gjerne håndskrevne feltnotater. Ofte handler det også om problematikk knyttet til persongjenkjenning og samtykke.

 –  De humanistiske fagene og samfunnsfagene har generelt hatt liten fokus på gjenbruk, og begrunnelsen for dette er ofte at det dreier seg om personsensitive data. Men dette er ikke en god løsning, presiserer hun.

– I tillegg til at slike data ofte er krevende og kostbare å hente inn, kan innhentingen også være belastende for personene som dataene hentes fra. Har du for eksempel en sjelden sykdom, kan det være fint å få slippe å gi de samme opplysningene til flere forskere.

Deltakere i QUALIFAIR

Det utdanningsvitenskapelige fakultet: Institutt for lærerutdanning og skoleforskning ILS, Teaching Learning Lab (ILS), QUINT (ILS), SPeLL ved institutt for Spesialpedagogikk (ISP)

Det humanistiske fakultet: RITMO – senter for tverrfaglig forsking, FourM’s-lab/Institutt for Musikkvitenskap (IMV), Tekstlaboratoriet

Teologisk fakultet

Det medisinske fakultet: UiO:eColab - Institutt for helse og samfunn, Senter for kreftcelle-reprogrammering - KlinMed

Odontologisk fakultet

Det samfunnsvitenskapelige fakultet: Psykologisk institutt, Senter for Ekstremismeforskning (C-Rex), Sosialantropologisk institutt,

USIT FAIR@UIO

Universitetsbiblioteket UB: Spesialsamlingene og Digital Scholarship Center (DSC)

Andre nasjonale samarbeidspartnere: Norsk senter for forskningsdata NSD, Personvernombudet UiO, Tjeneste for sensitive data (TSD)

Internasjonale samarbeidspartnere: Go Fair, et initiativ fra en gruppe EU-stater for å fremme FAIR-prinsippene, Inter-university Consortium for Political and Social Research (ICPSR), en tjeneste som arkiverer forskningsdata innen humaniora og samfunnskunnskap for amerikanske universiteter og forskningsinstitusjoner; samt UK Anonymization Network (UKAN).

Målet er mest mulig automatikk

Som prosjektleder for FAIR@UIO leder Bergsaker arbeidet med å utvikle de tekniske løsningene i QUALI-FAIR. Hun beskriver en såkalt hub-node-organisering med ulike typer data i ulike noder. Programvaren som testes ut, og som det bygges videre på i prosjektet, er IBM Spectrum Discover. 

– Spectrum Discover bruker automatikk og skripting til å analysere filer og legge på riktige metadata. Vi ser for eksempel på hvor mye metadata som kan hentes inn automatisk ved lagring av bilder og videodata. Målet er at så mye som mulig skal hentes inn automatisk, men forskerne må også legge inn informasjon manuelt, presiserer hun.

Ressurser og prosedyrer og kursing i bruken av disse, vil ligge innenfor Teaching Learning Video Lab og QUALI-FAIR huben, i hvert fall i prosjektets første fase, ifølge Bergsaker.

På sikt ser hun imidlertid for seg at det kanskje er mer naturlig å legge QUALI-FAIR til Digital Scolarship Centre ved Universitetsbiblioteket.

Administrasjonen er UiOs hukommelse

I søknaden som ligger til grunn for QALI- FAIR listes det opp tre hovedmålgrupper for prosjektet. Disse er yngre forskere, ph.d.- og master studenter samt teknisk-administrative tilsatte.

– Vi er opptatt av at teknisk-administrativt ansatte må trekkes inn i arbeidet med å bygge opp og drifte denne tjenesten. Det vil bidra til at de får et eierskap til verktøyet, poengterer Klette.

Seniorrådgiver Maria Dikova ved ILS er blant de forskningsadministrative tilsatte i prosjektet.

– Forskere kommer til oss når de trenger ressurser. Da er det viktig at vi vet hvor ressursene befinner seg, og hvordan de kan brukes. Rollen til det teknisk-administrative miljøet er å sikre institusjonens hukommelse, sier hun.

– De teknisk-administrative ansatte er også viktig for driften av Qualifair, påpeker Klette.

– Organiseringen i huber og noder forutsetter at miljøene har teknisk-administrative ansatte som kan gi informasjon og veiledning til forskerne om rutiner og prosedyrer, som kan monitorere data, og som kan administrere forespørsler om tilgang.

– Hvorfor er QUALI-FAIR  rettet spesielt mot yngre forskere og ikke mot forskere generelt?

Vi ønsker selvfølgelig at forskere i alle aldersgrupper skal se verdien av dette verktøyet, men vi mener det er spesielt viktig at yngre forskere helt fra starten av sin karriere blir bevisste på betydningen av å legge til rette for gjenbruk av data. Dette handler om kompetanseheving og om å tenke prinsipielt og langsiktig, svarer Klette.

VIL ARBEIDE FOR EN KULTURENDRING: – Det vi ønsker, er en kulturendring hvor man tenker samtykkeløsninger som støtter gjenbruk fra dag én, sier professor Kirsti Klette.

­Målet er en kulturendring

QUALI-FAIR- prosjektet skal gå over tre år.

– Målet er at vi i løpet av disse tre årene skal få på plass rutiner og prosedyrer for hvordan man kan gjøre persongjenkjennende og kontekstavhengige data, det vi omtaler som vanskelige data, tilgjengelige for flerbruk og gjenbruk.

– Målsettingen er også at disse prosedyrene og standarder skal være minst mulig arbeidskrevende for forskerne, supplerer Bergsaker.

– Vi håper også at vi er kommet et godt stykke på vei i arbeidet med å bygge opp arkiver med data som er søkbare og tilgjengelige, sier Kirsti Klette og presiserer at det ikke betyr at alle data kan være åpne. Ofte vil det dreie seg om gradert tilgang og ‘open upon request’.

– Lykkes prosjektet, vil UiO være helt i front i verden i arbeidet med å gjøre data FAIR, og forskere fra hele verden kunne vende seg til UiO for å finne og be om tillatelse til å bruke data som kan være til nytte i deres prosjekter. For UiO vil dette bli et viktig konkurransefortrinn.

 

 

 

Emneord: Det utdanningsvitenskapelige fakultet, Forskning Av Grethe Tidemann
Publisert 22. des. 2021 05:00 - Sist endra 22. des. 2021 09:33
Legg til kommentar

Logg inn for å kommentere

Ikkje UiO- eller Feide-brukar?
Opprett ein WebID-brukar for å kommentere