Behandling og lagring

Forskningsdata har stor verdi og det er viktig at de lagres forsvarlig for å sikre at dataene ikke går tapt eller blir reduserte i kvalitet. Behandling og lagring av forskningsdata kan være utfordrende, spesielt om man har store datasett eller data som setter spesielle krav til sikkerhet. Når vi samler inn data, er det viktig at vi er oppmerksomme på lagring, strukturering og dokumentasjon av dataene.

"Forskeren skal sørge for at forskningsdata lagres og behandles fortløpende på en sikker måte i henhold til Ledelsessystem for informasjonssikkerhet og personvern ved UiT." - Prinsipper og retningslinjer for forvaltning av forskningsdata ved UiT

Det er prosjektledere og veiledere som har det daglige ansvaret for at informasjonssikkerheten ivaretas i forskningsprosjekter.

God navnsetting, strukturering og dokumentasjon av forskningsdata er viktig for at man skal kunne finne, forstå og bruke dataene riktig. Dette er spesielt viktig når man jobber i grupper eller skal dele datasett med andre. Kvalitetssikrede forskningsdataarkiv stiller strenge krav til god struktur og dokumentasjon av data som arkiveres. Men det er minst like viktig at man holder orden også for egen del, slik at man effektivt kan finne frem i og forstå egne data også i fremtiden.

Det kan også dukke opp uforutsette kostnader relatert til databehandling og lagring. Det er derfor viktig å planlegge databehandlingen tidlig.

Strukturering og dokumentasjon

Om systematisering og organisering, metadata og beskrivelser av data

Strukturering og dokumentasjon

UiTs Prinsipper og retningslinjer for forvaltning av forskningsdata ved UiT pålegger alle ansatte og studenter å dokumentere sine data etter beste praksis og med tanke på fremtidig gjenbruk:

«Forskningsdata skal utstyres med dokumentasjon i form av metadata, metodebeskrivelser og varige identifikatorer som gjør andre forskere i stand til å søke etter og ta i bruk dataene. Metadata skal følge internasjonale standarder/de facto-standarder der dette finnes og gi en beskrivelse av datainnholdet med tanke på fremtidig bruk.»

Det er viktig at alt arbeid med forskningsdata dokumenteres grundig ved hjelp av rikelig med metadata og en beskrivende ReadMe-fil. Det er god praksis å begynne dokumentasjonen tidlig og fortsette å legge til informasjon i løpet av prosjektet. Prosedyrer for dokumenteringen bør etableres allerede i planleggingsfasen. Dersom strukturering og dokumentasjon er noe du utsetter til senere, er det fare for at viktig informasjon blir borte eller blir direkte feil. Det kan spare deg mye tid og unødvendig dobbeltarbeid om du planlegger arbeidet nøye.

Metadata er strukturert og standardisert informasjon om dataene dine. Økt fokus og krav om metadata skyldes at de er essensielle for å gjøre forskningsdata FAIR. Maskinlesbare metadata-skjema muliggjør indeksering og søk, og sørger for kontekstuell informasjon som er viktig for å forstå og gjenbruke dataene på tvers av teknologiske plattformer, institusjoner og landegrenser. Kvaliteten og omfanget på metadataene avgjør graden av FAIR. Det er derfor viktig at dataene dokumenteres ved hjelp av vel-utfylte metadataskjema.

Mange dataarkiv, organisasjoner og tidsskrifter stiller egne krav til metadata. Sjekk dette på et tidlig tidspunkt så du vet hvilke metadata du bør samle for ditt prosjekt.

Det er utviklet mange ulike standarder for metadata-dokumentasjon, både generiske og fagspesifikke. Følg de vitenskapelige konvensjonene som er utviklet for ditt fag, og når det er mulig bør du benytte standardiserte termer, taxonomier/ontologier og vokabular. Eksempler på generiske metadata-standarder er Dublin Core, Darwin Core (biologi), og Data Documentation Initiative. Oversikter over ulike standarder finnes hos Research Data Alliance, FAIRSharing.org og Digital Curation Centre.

For enkelte metadata-standarder er det utviklet verktøy som kan forenkle dokumenteringen. Men for de fleste tilfeller vil det være mest hensiktsmessig å samle informasjonen i en ReadMe-fil som lagres sammen med dataene (se nedenfor). Dette vil også være beste måten å dokumentere forskningen om det ikke finnes noen metadata-standard for ditt fagfelt.

ReadMe-filer er rene tekstfiler som er utbredt brukt for å beskrive programvarepakker. Når man jobber med data kan det være nyttig å lage en ReadMe-fil som følger datasettet og fungerer som en guide for å forstå dataene. ReadMe-fila skal sørge for at dataene kan forstås av deg selv på et senere tidspunkt, eller av andre når datasettet deles og publiseres.

Det anbefales at man oppretter ReadMe-fila på et tidlig tidspunkt og legger den i hovedmappa for datasettet. Her kan fila oppdateres hver gang man har utført en operasjon på dataene.

ReadMe fila skal beskrive hvordan datasettet er opprettet, hvor fullstendig det er, og hva slags hvilkår det eventuelt er på gjenbruk. Mye av innholdet i en ReadMe-fil vil overlappe med generell metadata-info, men ReadMe-fila skal i tillegg inneholde detaljert metodebeskrivelse, samt oversikt over filene og forklaring på filenes innhold. Vær spesifikk og tydelig i beskrivelsene. Definer uttrykk og akronymer, og bruk etablerte fagtermer. Dette er essensielt for å gjøre datasettet FAIR og gjenbrukbart. En bonuseffekt ved å føre en god metodebeskrivelse i ReadMe fila, er at teksten kan gjenbrukes i artikkelpublikasjoner.

En ReadMe-fil må minimum inneholde dette:

Generell bakgrunnsinformasjon (tittel, DOI, kontaktinfo, dato, sted, eierskap, finansiør).
Metodebeskrivelser (protokoller, instrumenter, programvare).
Filoversikt.
Filspesifikk informasjon med oversikt over variabler og enheter.
Referanse og vilkår for gjenbruk.

Du finner maler og eksempler på ReadMe-filer i brukerguiden for UiT sitt forskningsdataarkiv, DataverseNO.

Eksempler på annen relevant dokumentasjon som bør følge datasettet:

Beskrivelser, instruksjoner og protokoller for innsamling, prosessering og analysesteg.
Konfigurasjonsfiler og loggfiler fra kalibrering, prosessering og analyse.
Ordbøker og kode-skjema.
Variabellister.
Informasjonsskriv og samtykkeskjema.
NSD-meldeskjema og etiske godkjenninger.
Spørreskjema og intervjuguide.
Tillatelser og lisenser fra eventuelle rettighetsinnehavere.

Systematisering og navngiving av filer og mapper
Det er viktig at du og dine kollegaer på et tidlig tidspunkt enes om hvordan forskningsdataene skal organiseres og at dette følges av alle involverte parter. Lag en plan for hvordan dataene skal systematiseres i filer og mapper, og hvordan disse skal navngis. Gode og konsise fil- og mappenavn vil være essensielt.

Generelle tips for organisering av filene:

Hierarkisk mappestruktur kan være nyttige for å holde orden og strukturere dataene.
Organiser mappene i relevante kategorier.
Bruk konsistent navnestruktur på alle mappene. La navnestruktur på mappene gjenspeile innholdet i mappene.
La mappestrukturen gjenspeiles i filnavnene. Da blir lettere å beholde orden når du senere skal arkivere dataene.

Bruk en navnsetting som er meningsbærende i prosjektet. Det skal være mulig å forstå innholdet i en fil uten å åpne den.

Noen grunnleggende råd for valg av navn på filer og mapper:

Bruk konsistente filnavn.
Bruk beskrivende, men korte filnavn (< 25 tegn).
Unngå mellomrom. I stedet kan du bruke understrek (f.eks. first_study), bindestrek (f.eks. first-study) eller kamelstil (FirstStudy).
Unngå spesielle tegn som \ / ? : * ” > < | : # % ” { } | ^ [ ] ` ~ æÆ øØ åÅ äÄ öÖ.
Bruk internasjonal datoformat: ÅÅÅÅ-MM-DD (t.d. 2021-06-01).
Bruk flere siffer dersom filene nummereres (f.eks 001 i stedet for 1). Da unngår man rot ved sortering.

Noen elementer som kan inkluderes i filnavn er f.eks:

Dato/ tidsintervall/sted.
Navn på studie/prosjekt.
Versjonsnummer.
Fil-innhold.
Navn/initialer på forskeren.

Unngå:

Ikke-beskrivende, generiske mappenavn som f.eks «Aktuelt».
Personnavn på mapper innad i et prosjekt, mappenavn skal gjenspeile innholdet.
Overlappende kategorier eller flere lignede mapper plassert på ulike steder.
Flere kopier av samme fil i forskjellige mapper. Ved behov kan man lage snarveier til en fil.

Fil- og mappenavn styrer gjerne hvordan filene sorteres. Dermed kan ønsket sortering være avgjørende for valg av navnesyntaks.

Husk å dokumentere struktur og navnesyntaks i en ReadMe-fil (se ovenfor) som plasseres på øverste nivå i mappehierarkiet.

Dersom du ønsker å lære mer om strukturering og dokumentering av forskningsdata arrangeres det hvert semester et webinar om temaet. På kurssiden vil du også finne powerpointpresentasjon med mer informasjon.

Dersom du trenger råd og veiledning relatert til metadata og dokumentasjon kan du kontakte forskningsstøtte-teamet på researchdata@hjelp.uit.no.

Sist endret: 14.12.2023, endret av: Noortje Haugstvedt
Link: https://uit.no/forskning/forskningsdata/art?p_document_id=729087#modal_729149

Sikker lagring, innsamling og bearbeiding

Om sikkerhetsklassifisering og håndteringsrutiner for ulike typer data

Sikker lagring, innsamling og bearbeiding

I henhold til Ledelsessystem for informasjonssikkerhet skal forskningsdata være tilgjengelig for de som trenger det (tilgjengelighet), de skal sikres mot utilsiktet og urettmessig endring (integritet), og de skal ikke være tilgjengelig for uvedkommende (konfidensialitet). Studenter og ansatte plikter å gjøre seg kjent med innholdet og følge retningslinjene. Merk at man også plikter å forhindre og rapportere avvikshendelser gjennom avviksmeldingssystemet.

Integritet og tilgjengelighet handler om at data lagres på et driftssikkert system som sikkerhetskopieres. Som ansatt eller student ved UiT vil du ha tilgang til skytjenesten Office 365, med SharePoint og OneDrive. Data som ligger på disse tjenestene blir automatisk sikkerhetskopiert. Det anbefales at forskningsdata legges på Sharepoint, mens OneDrive kun benyttes til personlig lagring. Det er fordi innhold på OneDrive automatisk slettes når en bruker forlater institusjonen.

For å sikre konfidensialitet skal all data ved UiT sikkerhetsklassifiseres. Kategoriene gitt i styringssystemet er åpen/grønn, intern/gul, fortrolig/rød eller strengt fortrolig/svart. Klassifiseringen ligger til grunn for vurderingen av hvilken grad av sikring (IT-teknisk, organisatorisk og fysisk) informasjonen skal underlegges.

I praksis betyr dette at du må klassifisere dine data for rett sikkerhetsnivå (se Retningslinjer for klassifisering av informasjon). Dette vil så avgjøre hvor og hvordan dataene skal håndtere og eventuelt beskyttes. I Office 365 er klassifiseringen synligjort som etiketter ved hjelp av Azure Information Protection (AIP).

Gjennom risikovurderinger avgjør IT-avdelingen hvilke typer datakategorier de ulike tjenestene og systemene er godkjente for. Du kan lese mere om godkjente tjenester for forskjellige type data på "Hvilke tjenester kan du bruke til hvilket innhold?"

Privat utstyr og private lisenser skal ikke brukes til behandling av forskningsdata, fordi man da behandler UiT-data i privat regi. Man vet da ikke om sikkerheten er ivaretatt, og mange skytjenester befinner seg dessuten i land som omfattes av andre lovverk. UiT mister kontroll på disse dataene og vil ikke være i stand til å oppfylle lovkrav som f.eks. personvernforordningen.

Ved lagring på bærbar PC eller eksterne lagringsmedium må man vurdere risikoen for at disse kan gå tapt og ta forholdsregler.

Tjenester for lagring og bearbeiding av forskningsdata
SharePoint kan brukes som delingstjeneste ved samarbeid med andre forskere. Verktøyet kan også brukes til samskriving av artikler eller bokmanus. For overføring av større filer til andre kan FileSender levert av Sikt være et alternativ.

De som har behov for å dokumentere eksperimentelt arbeid kan benytte den elektroniske labnotatboka RSpace Enterprise.

Om du har spesielle behov for beregnings- og lagringsressurser kan du lese mer om hva IT-avdelingen har å tilby: Lagring og publiserings av forskningsdata.

Prosjekter som jobber med sensitivt materiale, bør vurdere å inngå en avtale med Tjenester for sensitive data (TSD). De tilbyr sikre løsninger for lagring og bearbeiding som dekker hele arbeidsflyten, fra innsamling via nettskjema, til behandling og analyse.

Dersom du ønsker å lære mer om behandling og lagring av forskningsdata arrangeres hvert semester webinarene «Lagring av forskningsdata» og «Datavask og ryddige regneark». For de som jobber på lab kan det være aktuelt å få med seg kurset i bruk av den elektroniske labnotatboka RSpace. På kurssidene vil du også finne powerpointpresentasjon med mer informasjon.

Sist endret: 14.12.2023, endret av: Noortje Haugstvedt
Link: https://uit.no/forskning/forskningsdata/art?p_document_id=729087#modal_729150

Elektronisk labnotatbok (ELN)

ELN RSpace er tilgjengelig ved UiT

Elektronisk labnotatbok (ELN)

UiT har inngått en avtale med en tilbyder av en elektronisk labnotatbok, RSpace Enterprise. Tjenesten oppfyller sikkerhetskravene ved UiT og ansees som et juridisk gyldig alternativ til den tradisjonelle labboken. Dette er et viktig steg for å sikre integriteten og tilgjengeligheten av laboratoriedata produsert ved UiT.

RSpace Enterprise er en fleksibel og generisk elektronisk labnotatbok som kan tilpasses mange typer eksperimentelt arbeid og datahåndtering. Systemet legger til rette for nye arbeidsmåter som effektiviserer arbeidsflyten, stimulerer til gjenbruk, og gir økt transparens og reproduserbarhet.

Lett å samarbeide og dele dokumenter innad i prosjekter.
Sikkerhet: Revisjonssporing, digital signering av dokumenter, og det er ikke mulig å slette innhold.
Tidsbesparende: Avanserte søkefunksjoner og gjenbruk av skjema og maler.
Tilgjengelighet: Alle filer lagres samlet i skyen.
Integrasjon med en rekke elektroniske tjenester, bl.a. OneDrive, ChemAxon Marvin, eCAT, Protocols.io, SnapGene og Dataverse (DataverseNO).
Full mobilitet av arbeidet. Dokumenter kan eksporteres i flere formater. Data generert av gjesteforskere og studenter forblir tilgjengelig, samt at de kan få med seg en kopi.

Hvordan komme i gang med RSpace
RSpace er nettleserbasert og er kompatibel med mobil, nettbrett og PC/Mac. UiT har en egen RSpace-server. For å opprette en bruker-konto:

Gå inn på http://uit-rspace.researchspace.com/ og logg inn med din FEIDE-profil.
Registrer lisensen ved å sende en epost med navn, stilling og tilhørighet til researchdata@hjelp.uit.no.

Før du tar i bruk RSpace
En av de største fordelene med å ta i bruk en elektronisk labnotatbok er å samarbeide med kollegaer og/eller studenter. Dette gjøres ved å opprette en digital labgruppe. Hver labgruppe må ha en principal investigator (PI). En PI vil kunne administrere labgruppen og ha innsikt i alle filer i gruppa. Før man starter opp med RSpace er det lurt å ha en plan om hvordan labgruppen(e) skal være organisert, hvem som skal være PI og hvorvidt det skal være en åpen eller lukket lab. Klikk her for å laste ned vårt hjelpedokument som forklarer om roller og organisering på RSpace, eller kontakt UiTs support team. Ønsker du å bli PI og opprette en ny labgruppe send epost til researchdata@hjelp.uit.no.

Opplæring og støtte
Siden RSpace er en tjeneste som tilbys av UiT er det mulig å få teknisk assistanse og oppfølging ved behov. Send epost til researchdata@hjelp.uit.no.

Hvis du ønsker å lære mer om elektronisk labnotatbøker arrangeres det hvert semester et webinar om temaet. Vi holder også interaktive workshops om ELN RSpace. På kurssiden vil du finne mer informasjon.

Ressurser
Mer informasjon om funksjonene i RSpace finner du her: UiTs videor om RSpace, hjelpe-PDF (norsk), roller og organisering (PFD), RSpace Inventory (PDF) eller på RSpace sine hjelpesider (engelsk) og YouTube-kanal (engelsk).

Sist endret: 14.12.2023, endret av: Noortje Haugstvedt
Link: https://uit.no/forskning/forskningsdata/art?p_document_id=729087#modal_729151

Sist endret: 12.11.2021, endret av: Majda Sojtaric

Forskningsdataportalen