Ny transkriberingstjeneste ved UiT

Nå kan ansatte og studenter ved UiT fritt transkribere lydmateriale på 61 språk. Tjenesten har en lav feilrate og kan også behandle fortrolige data.

En gruppe mennesker som står på linje.
Feirer lanseringen av tjenesten Klartekst. Ansatte ved Seksjon for virksomhetsnære tjenester: Marko Lukic (t.v), Øystein Tveito, Rolf Andersen, Erik Heggeli og Steinar Trædal-Henden. Ansatte ved Institutt for helse- og omsorgsfag (IHO): Anne-Sofie Sand, Elin Helbekkmo og Mona Skjeklesæther-Pettersen. Foto: Kim Bredesen / UiT.
Portrettbilde av Bredesen, Kim
Bredesen, Kim kim.bredesen@uit.no Rådgiver
Publisert: 16.02.24 14:00 Oppdatert: 20.02.24 15:37
Om UiT Teknologi

UiTs nye transkiberingstjeneste, Klartekst for tale-til-tekst transkiberer lydopptak effektivt og med høy kvalitet.

Programvaren er basert på kunstig intelligens og er tilgjengelig for ansatte og studenter på UiT på klartekst.uit.no.

Kapasiteten til klartekst

Klartekst kan transkribere lydfiler på 61 språk. Teksten kan leveres i flere format, også som undertekster til videoopptak av forelesninger og annet audiovisuelt materiale.

Fire personer står i ring.
Steinar Trædal-Henden (t.v.) deler ut løpesedler på UiT i Tromsø under lanseringen av Klartekst. Foto: Kim Bredesen / UiT.no

Steinar Trædal-Henden, faggruppeleder for forskning og formidling i seksjon for virksomhetsnære tjenester, mener den nye tjenesten kan være til god nytte for flere brukergrupper.

– Tjenesten vil være enormt tidsbesparende og også økonomisk besparende. Klartekst vil kunne transkribere langt raskere enn et menneske er kapabelt til, understreker han.

Han forteller at resultatene med uttesting av Klartekst har vært gode, men har tips til brukere om de skulle støte på problemer.

– Ettersom tjenesten bygger på KI kan det av og til forekomme at den hallusinerer, og resultatet kan da bli noe annet enn det skulle. Beste tips da er bare å kjøre den igjen, påpeker Trædal-Henden.

Tjenesten vil være enormt tidsbesparende og også økonomisk besparende. Klartekst vil kunne transkribere langt raskere enn et menneske er kapabelt til.

Trygg behandling av data

Systemet til UiT er også godkjent for å motta såkalte røde (fortrolige) data, fordi det ikke deler informasjon med noen tredjepart. Det kan derfor brukes til å transkribere sensitive intervjuer og lignende materiale. De som leverer inn lydmateriale til Klartekst fyller ut et samtykkeskjema hvor disse betingelsene er ført opp.

En som har arbeidet med dette slike spørsmål er Geraldine Mabille, datakoordinator ved Regionalt kunnskapsenter for barn og unge (RKBU). Hun gir veiledning til forskere og tilbyr støtte til prosjekter innen håndtering av forskningsdata. For henne representerer Klartekst et betydelig framskritt når det gjelder behandling av røde data.

– Dette utgjorde virkelig et gap i de teknologiske fremskrittene som har pågått overalt rundt oss, at vi fremdeles var nødt til å transkribere ting manuelt i KI-æraen. Så det vil hjelpe oss mye å bruke det nye systemet, uttaler Mabille.

På sikt mener Steinar Trædal-Henden det vil bli mulig å utvikle en transkriberingsløsning for også samiske språk. Men da må da må det først utvikles en modell hvor KI trenes opp.

Hva Klartekst bygger på

Parallelt med at UiT har utviklet en egen tjeneste for transkripsjon lanserer Nasjonalbiblioteket også et eget transkriberingsprogram den 15. februar, kalt NB Whisper. Det kan automatisk konvertere norsk tale til tekst, som inkluderer både bokmål og nynorsk.

Programmet er bygget på Whisper fra Open AI og er etter lanseringsdatoen fritt tilgjengelig i en betaversjon. Sistnevnte kan transkribere tale fra 90 språk.

Kapasiteten Whisper har hatt til nå på transkribering, på norsk, har imidlertid til nå ikke vært av tilstrekkelig høy kvalitet til å nå utbredt bruk.

Dette har Nasjonalbiblioteket gjort noe med og NB Whisper er øvet opp blant annet gjennom 60.000 timer transkribert norsk tale fra Stortinget og NRK. Med NB Whisper er nå feilraten på transkribering av norsk tale redusert til 2,5 prosent.

Bredesen, Kim kim.bredesen@uit.no Rådgiver
Publisert: 16.02.24 14:00 Oppdatert: 20.02.24 15:37
Om UiT Teknologi
Vi anbefaler