Å finne relevante data
For å auke nytta frå data som forskarar har samla inn, eller generert på ein lab, er det etter kvart blitt krav om, og meir og meir vanleg at data blir gjort tilgjengelege i åpne arkiv, slik at dei kan gjenbrukast av andre. Ved gjenbruk av data frå tredjepart må forskaren sikre at lisensar og gjeldande vilkår ved bruk eller deling blir overhaldne.
Dersom du er i ferd med å planleggja ditt neste prosjekt, bør søking etter eksisterande data vere med i planane. Kanskje finst det data som du kan nytta saman med dine eigne data, for å utvida analysegrunnlaget i prosjektet ditt. Eller kanskje er det mest interessant å samanlikne dine eigne data med data andre har samla inn. Det å bruke tid på å kartleggje kva som finst av data som du kan ha nytte av, er difor noko du bør sette av tilstrekkeleg med tid til. Tenk gjennom, og søk gjerne hjelp til, korleis du kan finna nyttige data i åpne arkiv: Kva for kjelder finst å søkja i, og korleis bør du søkja. Å byggje opp eit såkalla systematisk søk i dei rette kjeldene kan visa seg særs nyttig.
Her er tre internasjonale kjelder som vi vil tilrå for søking etter forskingsdata:
DataCite: https://datacite.org/
Google Dataset Search: https://datasetsearch.research.google.com/
BASE: https://www.base-search.net/
Dei to førstnemnde er kjelder som berre gir treff på datamateriale. BASE, derimot, inneheld alle typar forskingsmateriale, inkludert data.
Norsk kjelde: Microdata
UiT har ein avtale med Statistisk sentralbyrå (SSB) om bruk av microdata.no, ei teneste som gir forskarar og studentar tilgang til Statistisk sentralbyrå sine anonymiserte data om folk, utdanning, inntekt, arbeidsmarknad og trygd, som ein kan gjennomarbeide og analysera. Du finn meir informasjon her.
Andre kjelder
I UiT sitt eige arkiv for forskningsdata, UiT Open Research Data (opendata.uit.no), kan ein finna data som andre UiT-forskarar har arkivert. Men alt du finn der vil du óg finna i dei tre internasjonale kjeldene nemnde ovanfor.
Tromsøundersøkelsen kan óg nemnast som ei interessant kjelde. Dette er Noregs mest omfattande befolkningsundersøkjing gjennom meir enn 40 år. Alle forskarar tilknytte institusjonar med forskingskompetanse kan søkja om tilgang til å analysera data frå Tromsøundersøkelsen. Informasjon om korleis du søkjer om tilgang til data frå Tromsøundersøkelsen finn du her.
Sitering av datasett
Om du nyttar datasett frå andre i forskinga di, så skal du referera til dette på same måte som du refererer til den forskingslitteratur du byggjer på, ved å ta med referanse til det aktuelle datasettet i referanselista. Dette gjelder uansett kva lisens for gjenbruk datasettet har.
Arkiverte datasett finst normalt berre i digital versjon. Difor må referanse til datasett alltid innehalde lenkje til datasettet. Og lenkja bør byggja på persistente identifikatorar, til dømes DOI eller handle, slik at lenkja ikkje rotnar. Alle kvalitetssikre dataarkiv nyttar slike persistente identifikatorar.
Eit datasett kan ha fleire versjonar. Det kan vere at feil er retta opp, eller at datamaterialet er endra eller utvida etter at det først blei publisert. Alle slike endringar gjer at datasettet får ny versjon. Difor er det viktig at versjonsnummeret er med i referansen til datasettet. Når andre finn referansen i referanselista di, så vil dei vite kva for ein versjon av datasettet forskinga di byggjer på. Og eit dataarkiv bør difor ha versjonssporing, slik at alle tidlegare versjonar er tilgjengelege for den som vil etterprøva noko.
Her er eit døme på korleis ein referanse til eit datasett kan sjå ut (henta frå https://www.usgs.gov/atom/43103):

Dersom du ønsker å lære meir om søking og sitering av forskingsdata, blir det kvart semester halde webinar om temaet, på norsk og engelsk. På kurssida vil du og finne powerpoint-presentasjonen frå desse webinara tilgjengeleg.