Å finne relevante data
For å øke nytten fra data som forskere har samla inn eller generert på ein lab, er det etter hvert blitt krav om, og mer og mer vanlig at data blir gjort tilgjengelige i åpne arkiv, slik at de kan gjenbrukes av andre. Ved gjenbruk av data fra tredjepart må forskeren sikre at lisenser og gjeldende vilkår ved bruk eller deling blir overholdt.
Dersom du er i ferd med å planlegge ditt neste prosjekt, bør søking etter eksisterende data være med i planene. Kanskje fins det data som du kan bruke sammen med dine egne data, for å utvide analysegrunnlaget i prosjektet ditt. Eller kanskje er det mest interessant å sammenlikne dine egne data med data andre har samla inn. Det å bruke tid på å kartlegge hva som fins av data som du kan ha nytte av, er derfor noe du bør sette av tilstrekkelig med tid til. Tenk gjennom, og søk gjerne hjelp til, hvordan du kan finne nyttige data i åpne arkiv: Hvilke kilder fins å søke i, og hvordan bør du søke. Å bygge opp et såkalt systematisk søk i de rette kildene kan vise seg svært nyttig.
Her er tre internasjonale kilder som vi vil anbefale for søking etter forskningsdata:
Dei to førstnemnde er kilder som bare gir treff på datamateriale. BASE derimot inneholder alle typer forskningsmateriale, inkludert data.
Norsk kilde: Microdata
UiT har en avtale med Statistisk sentralbyrå (SSB) om bruk av microdata.no, en tjeneste som gir forskere og studenter tilgang til Statistisk sentralbyrå sine anonymiserte data om folk, utdanning, inntekt, arbeidsmarked og trygd, som man kan gjennomarbeide og analysere.
Andre kilder
UiT har en samling i det nasjonale forskningsdataarkivet DataverseNO, der man kan finne data som UiT-forskere har arkivert. Men alt du finner der, vil du også finne i de tre internasjonale kildene nevnt ovenfor.
Tromsøundersøkelsen kan også nevnes som en interessant kilde. Dette er Norges mest omfattende befolkningsundersøkelse gjennom mer enn 40 år. Alle forskere tilknyttet institusjoner med forskningskompetanse kan søke om tilgang til å analysere data fra Tromsøundersøkelsen. Du finner mer informasjon om hvordan du søker om tilgang til data fra Tromsøundersøkelsen finner du på deres nettsider.
Sitering av datasett
Om du bruker datasett fra andre i forskningen din, så skal du referere til dette på samme måte som du refererer til den forskingslitteratur du bygger på, ved å ta med referanse til det aktuelle datasettet i referanselista. Dette gjelder uansett hvilken lisens for gjenbruk datasettet har.
Arkiverte datasett fins normalt bare i digital versjon. Derfor må referanse til datasett alltid inneholde lenke til datasettet. Og lenken bør bygga på persistente identifikatorer, for eksempel DOI eller handle, slik at lenken ikke råtner. Alle kvalitetssikrede dataarkiv bruker slike persistente identifikatorer.
Et datasett kan ha flere versjoner. Det kan være at feil er retta opp, eller at datamaterialet er endra eller utvida etter at det først blei publisert. Alle slike endringer gjør at datasettet får ny versjon. Derfor er det viktig at versjonsnummeret er med i referansen til datasettet. Når andre finner referansen i referanselista di, så vil de vite hvilken versjon av datasettet forskningen din bygger på. Og et dataarkiv bør derfor ha versjonssporing, slik at alle tidlegere versjoner er tilgjengelige for den som vil etterprøve noe.
Her er et eksempel på hvordan en referanse til et datasett:
Conzett, Philipp, 2022, "Dataverse Community Survey 2022 – Data", https://doi.org/10.18710/UOC8CP, DataverseNO, V1
(Author, Publication Year, "Title", persistent link, Name of Archive, V1)
Dersom du ønsker å lære mer om søking og sitering av forskningsdata, blir det hvert semester arrengert webinar om temaet, på norsk og engelsk. På kurssida vil du også finne powerpoint-presentasjonen fra disse webinara.