Nå skal forskningsdata deles

Professor ved Tromsø Museum, Robert T. Barrett har samlet inn data om sjøfugler siden tidlig på 70-tallet. Nå blir det tilgjengelig for alle.
Aarskog, Karine Nigar
Publisert: 30.08.16 21:00 Oppdatert: 31.08.16 12:56

Robert Barrett veier lomviunger på Hornøya i juli 2008.
Robert Barrett veier lomviunger på Hornøya i juli 2008. Foto: Adrien Brun

Han har telt krykkjer i fuglefjell og vet når gjøken pleier å komme til Tromsø hver vår. Han har sett på mageinnholdet til et utall lundefugl på Hornøya for å finne ut hva de spiser og studert reir, egg og klekking. Alt er sirlig notert i små, grønne notisbøker som står i en bokhylle på kontoret hans på Tromsø Museum. Professor Robert T. Barrett har jobbet med sjøfugler og trekkfugler i over 40 år og kan det som er verdt å vite om disse fuglene.

– Jeg har vært heldig som har fått samle inn data i over 30 år. Disse langtidsseriene  er gull verdt, sier Barrett.

Nå nærmer han seg pensjonsalder, og han mener det er viktig at hans forskningsdata kan brukes videre av andre i framtida. 

– Det ville være fryktelig synd hvis disse dataene bare havner i et fysisk arkiv i kjelleren her på museet og dermed blir vanskelig tilgjengelig. Andre som kommer etter meg eller er på andre institusjoner kan ha nytte av materialet som jeg har samlet inn, sier han.

Mange muligheter
En ny tjeneste fra Universitetsbiblioteket (UB) og IT-avdelingen ved UiT gjør nå forskningsdata tilgengelig på en helt annen måte enn tidligere. UiT Open Research Data, som lanseres 1. september, er en database der ansatte og høyere gradsstudenter ved UiT kan arkivere sine åpne forskningsdata, slik at de blir mer synlig og lettere søkbare for alle. Fugledataene til Barrett er bare et av mange eksempler på slik forskningsdata. Han er en av forskerne som har vært med på et pilotprosjekt, der en rekke datasett er blitt arkivert ved hjelp av ansatte ved UB. Til nå ligger det 53 dataposter med til sammen 657 filer i databasen, men de som har utviklet den håper på mange flere i tida som kommer.

– Arkivet gir mange muligheter. Fugleinteresserte kan selv gå inn og se når trekkfuglene er observert i Tromsø de siste årene. Eller man kan utvikle ny forskningsvirksomhet på bakgrunn av tidligere datasett og bygge videre på data som allerede finnes. Også for media blir dette et nyttig verktøy, fordi de kan få tilgang til originaldata bak forskningsresultater, sier leder for UBs forsknings- og publiseringsstøtte, Stein Høydalsvik.

– Hele poenget med forskning er jo å utvide vår kunnskap om verden, og en av grunnsteinene i god forskningspraksis er å bygge på tidligere resultater. Med det aktuelle fokuset på forskningsdataarkiv åpnes det en ny verden for forskere som nå lettere kan få oversikt over og tilgang til eksisterende data, legger fagansvarlig og leder for UBs undervisning og læringsstøtte, Helene Andreassen til.

Nye konklusjoner
I dag er det også mye forskning som aldri blir publisert, fordi forskningen ikke gir klare svar eller ikke gir spennende nok resultater. 

– Også disse dataene bør være tilgjengelig, for å unngå dublisering av forskningen, og slik at andre forskere i stedet kan bygge videre på dataene. Enhver konklusjon bør være etterprøvbar, sier fagansvarlig ved UB, Philipp Conzett.

Det finnes allerede gode eksempler på at man har kommet fram til nye konklusjoner ved å bruke gammelt datamateriale på nytt. Ved University of California San Francisco fant man en tidligere ukjent sammenheng mellom rehabilitering av ryggmargsskadde og blodtrykket de hadde under sine første operasjoner. Nevrologer og statistikere kom fram til konklusjonen da de gikk gjennom og analyserte gammel data på nytt – data som for 20 år siden var blitt avskrevet som verdiløse. 

– Big data har svirret i lufta i lang tid, og når data blir sammensatt til større mengder, har man mulighet til å analysere dem på nye måter. Men vet ikke hva slags nytte og relevans data har i fremtiden, sier Høydalsvik.

Se intervju med Robert Barrett: 

Også Robert Barrett har opplevd å få ny kunnskap lenge etter at innsamlingen av data var gjort. I 1987 stupte lomvibestanden på Hornøya med 80-90 prosent, og forskerne konkluderte først med at arten hadde forsvunnet på grunn av lite lodde. Når forskerne i ettertid satte sine funn sammen med andres data fra samme tid, viste det seg at den dramatiske nedgangen også hang sammen med få torskelarver i havet, og at det var veldig kaldt i Stillehavet og Barentshavet den samme vinteren, på grunn av hele værsystemet på den nordlige halvkulen.

– Det var andre ting som spilte inn enn bare loddebestanden. Det var vi ikke klar over da vi samlet inn dataene, sier Barrett.

En moralsk plikt
UiT Norges arktiske universitet har vært ledende blant universitetene i Norge i arbeidet for åpen tilgang, såkalt open access, til forskningspublikasjoner, og har i 15 år utviklet nye tjenester for dette. UB bruker nå erfaringene herfra for å gjøre også forskernes data tilgjengelige.

– Gjennom åpen og transparent vitenskap bygger vi tillit i samfunnet og får en delingskultur også innenfor forskning, sier Høydalsvik.

Helene Andreassen, Leif Longva, Stein Høydalsvik og Philipp Conzett ved Universitetsbiblioteket gleder seg til lanseringen.
Helene Andreassen, Leif Longva, Stein Høydalsvik og Philipp Conzett ved Universitetsbiblioteket gleder seg til lanseringen. Foto: Karine Nigar Aarskog

Noen forskere er likevel skeptiske, fordi de frykter at andre kan ”stjele” deres materiale og ideer hvis de blir offentlig tilgjengelig. Til det har gjengen bak databasen et beroligende svar:

– I dag blir data ofte brukt uten at forskeren som står bak blir kreditert, og dette skyldes dels at man hittil ikke har hatt klare retningslinjer for hvordan man skal henvise til forskningsdata. Databaser som UiT Open Research Data forenkler situasjonen, ved at data som lastes opp blir tildelt en henvisning med en varig adresse. Dette gjør det lettere for andre å behandle forskningsdata som kilde, på lik linje med skriftlige publikasjoner og i tråd med god forskningspraksis, sier Andreassen.

For mange vil det også være naturlig å arkivere sine data når forskningsprosjektet er avsluttet, supplerer Conzett.

Robert Barrett med en av sine mange kladdebøker.
Robert Barrett med en av sine mange notisbøker. Foto: Karine Nigar Aarskog

Robert Barrett mener imidlertid at forskere har en moralsk plikt til å dele sine data:

– All data som vi som er ansatt i staten har samlet inn er offentlig, og vi bør dele det. Men mange yrkesaktive forskere har dessverre en tendens til å holde sine data for seg selv, for å være sikker på at ingen andre publiserer det, sier han.

Selv synes han det er positivt hvis andre vil bruke hans materiale:

– Det er helt i orden, særlig hvis de skriver i en liten parentes at det er jeg som har samlet det inn.

Krav til åpenhet
Det er også et stadig økende krav til åpenhet i forbindelse med finansiering av forskningsprosjekter. Forskningsrådet har ”åpen som standard” som sitt mantra, og det gigantiske forsknings- og innovasjonsprogrammet til EU, Horizon 2020, ønsker å bruke forskning til å fremme den generelle økonomien i Europa. Ifølge Høydalsvik vil det komme stadig strengere krav til databehandlingsplaner når man søker om midler.

– Målet er at omverden skal kunne bygge forretning rundt forskning og at også andre enn forskeren skal kunne dra nytte av den. I dag er det ikke et krav om å offentliggjøre sine forskningsdata, men man skal ha gode argumenter for ikke å gjøre det, sier han.

Høydalsvik legger til at diskusjonen om åpenhet rundt forskningsdata til nå har vært relativt fraværende i Norge, mens de fleste universiteter i Storbritannia og USA har egne arkiver for forskningsdata. UiT Open Research Data bruker samme programvare som Harvard universitet i USA, som har 60 000 datasett åpent for alle.

– Verktøyet er ikke komplisert, og fagansvarlige her på UB ser gjennom om filene er lagret i riktig format og om informasjonen er god nok. Det er en betjent tjeneste som UB leverer, sier Høydalsvik.

Målet er at tjenesten også skal integreres med andre systemer, så man kan søke på tvers av internasjonale nettverk.

– Forskningsdataen i vår base er en liten node i et større nettverk, og det skal bli enklere å finne data som man kan bygge videre på. Hittil har det vært en bratt tapskurve på forskningsdata fordi man ikke har hatt infrastruktur. Det finnes mange forskere som lagrer data på sin maskin, en USB-penn eller en annen ekstern lagringsenhet, som ikke er tilgjengelig for andre. Ufrivillig tap av data er et kjempeproblem, sier Høydalsvik.

Universitetsstyret ved UiT har også gitt signaler om at de ønsker en egen policy for håndtering av alle typer forskningsdata, og at UiT innen 2020 skal ha etablert tjenester for lagring av alle typer forskningsdata.

Kurs og opplæring
Når UiT Open Research Data lanseres ved UiT torsdag denne uka, blir det med stand flere steder på campus Tromsø, drop-in-samtaler for de som er interessert og speed-dating for rådgivere.

– De som er nysgjerrige på dette kan komme og snakke med oss, sier Andreassen.

UB tilbyr også fortløpende fortløpende opplæring i bruk av databasen gjennom åpne kurs for forskere og PhD-studenter, samt brukerveiledninger på nett. 

– Den kanskje største jobben forskerne våre vil ha fremover er å tenke databehandling og langtidsbevaring fra det øyeblikket de begynner å samle inn forskningsdata. Omstrukturering og omformatering av data i ettertid kan være tidkrevende, så det anbefales å ha gode rutiner fra starten, sier Andreassen. 

– Vi forskere kan alltid skjule oss bak at vi ikke har tid, men vi har en moralsk plikt. En ting er hva vi har publisert, men man burde være såpass stolt av det man har gjort at man lar alt materialet være tilgjengelig for etterfølgerne, avslutter Barrett. 

Vi anbefaler