Lager system i et kaos av digital informasjon

Maskinlæringsgruppa ved UiT finner mønster og sammenhenger der andre bare ser en haug av usammenhengende data.
Os, Vibeke
Bilde av forfatter finnes ikke, dette er en placeholder
Vibeke Os
Publisert: 16.01.17 12:00 Oppdatert: 26.01.17 14:45

Ettertraktede forskere forener sin kompetanse i forskningsgruppen «Machine Learning». Fra venstre, stipendiat Karl Øyvind Mikalsen, instituttleder Stian Normann Anfinsen, gruppeleder Robert Jenssen, stipendiat Michael Kampffmeyer og stipendiat Sigurd Løkse. Foto: Vibeke Os

Vi måler og kartlegger som aldri før og vi får stadig bedre instrumenter og sensorer som igjen gjør at vi får mer informasjon og enda mer presise data, men som er ingenting verd med mindre vi er i stand til å trekke informasjon ut av det. Det vil forskere ved UiT gjøre noe med.

Lager matematiske verktøy for å analysere data.
–Med økende og mer komplisert tallmateriale øker kravet til statistiske verktøy som er i stand til å forenkle og å presentere dette på en forståelig måte, forteller gruppeleder Robert Jenssen engasjert.

Grafisk fremstilling av data, her er det samme målesettet fremstilt på to ulike måter. Ifølge forskerne handler det om å fremstille kompliserte datasett på en slik måte at essensiell informasjon trer frem og tydeliggjøres. Foto: Jonas Myhre

Menneskets arvemateriale er kartlagt, med over seks billioner byggesteiner, det samme er laksens og sjimpansens. Flere ganger hver dag skannes jordens overflate av satellitter i verdensrommet og bildedata dumpes ned til stasjoner på jorda, på sykehus måles og sjekkes millioner av mennesker med ulike instrumenter, alt dette resulterer i enorme mengder data, og forskerne ved UiT jobber med å utvikle verktøy for å analysere de voksende datamengdene.

Sammenfallende forskningsinteresser gjorde at flere forskere ved Institutt for fysikk og teknologi i sommer slo seg sammen til èn forskningsgruppe, nemlig «Machine Learning», eller Maskinlæring på godt norsk. Interessen for arbeidet deres er ifølge gruppeleder Robert Jenssen stor og stadig økende.

Verktøy til energibransjen, bankanalyser og havfiske

– Vår gruppe er finansiert av forskningsrådet der vi har fått mye midler for å gå dypt ned i matematikken som ligger bak slike moderne analyseverktøy. I tillegg finansierer næringslivet en stor del av vår aktivitet. For eksempel utvikler vi moderne verktøy for å analysere bildedata fra firmaet eSmart systems som skal overvåke kraftlinjer for energibransjen. I tillegg jobber vi sammen med Santander bank for å analysere kredittrisiko og en av våre masterstudenter har nettopp samarbeidet med Sintef om et verktøy for å estimere fangtsmuligheter for havfiskeflåten, sier Robert Jenssen og fortsetter:

– Vi får jevnlig henvendelser fra næringsliv med spørsmål om vi har aktuelle kandidater til stillinger hos dem og det er betegnende at de henvender seg til oss, det er ikke mange som har liknende kompetanse i Norge på nettopp denne typen dataanalyse.

Forskeren forteller at mange er daglige brukere av verktøy tilsvarende det de jobber med uten av de vet det selv, for eksampel  i vanlige APP’er som Shazam (musikkgjenkjenning), What Bird (gjenkjenner fuglelåter) og i google sin søkefunksjon.

Maskinlæringsgruppa lager analyseverktøy som «lærer» maskinen å kjenne igjen objekter i bilder. I dette bildet til høyre vil datamaskinen kunne skille et sint og et blidt ansiktsuttrykk. Foto: Machine Learning

Ansiktsgjenkjenning
Ikke bare tallmaterie fra målinger kan analyseres av Jenssen og co, også bilder kan analyseres.

– Digitale bilder brytes ned i bildets miste bestanddel, en pixel eller et punkt. Hvert punkt gis ett tall og dermed blir hele bildet en digital komposisjon bestående av bare tall – og tall kan analyseres, utdyper Jenssen.

Det som kjennetegner denne gruppas arbeid er at de lager nye matematiske metoder som gjør at datamaskinen kan kjenne igjen elementer i et bilde og «huske» det til en annen gang den møter det samme objektet.

Blant annet brukes slike bildegjenkjenningsverktøy rutinemessig i alle digitale kamera for å finne ansikter for autofokus, og på noen flyplasser for å avsløre ettersøkte personer.

– Våre analysemetoder kan anvendes både til å karakterisere medisinsk bilder, flyfoto eller satellittbilder av jordkloden, blant annet for å kartlegge kraftlinjer og utbredelse av regnskog.

Eksempel på et PET-bilde av en rotte. En PET scanner gir avanserte bilder fra innsiden av kroppen og brukes blant annet til kreftdiagnostikk.  Foto: Samuel Kuttner

Har etablert samarbeid med PET senteret
Forskeren poengterer at det nye PET senteret i Tromsø vil trenge kompetanse og verktøy som maskinlæringsgruppa besitter, siden arbeidet ved den nye senteret vil generere store mengder bildemateriale som skal tolkes og analyseres.

Jenssen er veldig fornøyd med at en av PhD-stillingene ved PET-senteret har blitt vinklet i retning maskinlæring.

Prosjektets tittel er ”Advancing diagnosis and treatment for lung cancer patients using hybrid PET/MR imaging and novel visualization tools” og skal utføres av Samuel Kuttner med blant annet Rune Sundset og Robert Jenssen som veiledere. 

Første doktorgrad i maskinlæring
I oktober disputerte den første doktorgradsstipendiaten som ble ansatt i maskinlæringsgruppa, Jonas Nordhaug Myhre. Han jobbet først og fremst med å forenkle komplisert tallmateriale, slik at de enklere kunne la seg analysere.

Robert Jenssen forklarer at dersom en pasientgruppe blir kartlagt med målinger og sensorer vil de kunne gi opphav til for eksempel 200 000 separate målepunkter. Men legen ønsker kanskje å gruppere pasientene i bare 2 grupper, for eksempel i stor risiko for hjerteinfarkt og liten risiko for hjerteinfarkt.

Da er det viktig å kunne kategorisere disse helseopplysningene slik at det gir mening. For hjertepasienter vil blodtrykk og vekt være viktigere enn hårfarge og skostørrelse. Myhres arbeid gjør at store kompliserte datasett lettere kan analyseres og at eventuelle sammenhenger trer frem. Arbeidet hans er publisert i anerkjente internasjonale tidsskrift.

Gledelig studentrekruttering
Avslutningsvis kan Robert Jenssen fortelle at tilgangen på engasjerte studenter innen maskinlæring er stor, spesielt fra studieprogrammet ”Anvendt fysikk og matematikk”.

Kurset i maskinlæring er et av de største på NT-fak på masternivå, og antallet studenter som ønsker å gjøre masteroppgave innen maskinlæring er stor.

Les mer:
Doktorgradsavhandlingen til Jonas Myhre: «Machine Learning using Principal Manifolds and Mode Seeking».

eSmart systems

UiT samarbeider med storbank om dataanalyse

 

Os, Vibeke
Bilde av forfatter finnes ikke, dette er en placeholder
Vibeke Os
Publisert: 16.01.17 12:00 Oppdatert: 26.01.17 14:45
Vi anbefaler