UiT samarbeider med storbank om datanalyse

Maskinlæring er den mest moderne formen for datanalyse, og UiT har gjort seg bemerket på området. Santander Consumer Bank tok derfor initiativ til et samarbeid.
Solhaug, Randi Merete
Publisert: 10.06.16 00:00 Oppdatert: 10.06.16 10:15

Førsteamanuensis Robert Jenssen leder maskinlæringsgruppa ved UiT, og opplever at samarbeid med næringslivet er nyttig for utviklinga av feltet. Foto: Randi Solhaug

Det er utrolig hva man kan få fram av nyttig informasjon fra et enormt tallmateriale (Big data) ved hjelp av matematikk, statistikk, fysikk og dataprogrammering.

For eksempel kan man finne ut mer om risiko knyttet til utlån og nedbetalingsevne gjennom å analysere tall fra en bank. Spørsmålet er bare hvordan man på best mulig måte kommer fram til svaret.

Det ønsker Santander Consumer Bank å finne ut sammen med maskinlæringsgruppa på Institutt for fysikk og teknologi, ved UiT, og Norsk Regnesentral (NR).

Nyttig for begge parter

Banken anser maskinlæring som et veldig interessant felt, og ønsker å bli bedre på datanalyse og maskinlæring. De finansierer derfor en nærings-PhD ved UiT.

– Vi synes den beste fremgangsmåten å bygge kompetanse på, er gjennom et forskningsprosjekt. Vi ser derfor forskningen som en del av en langsiktig strategi for å bygge intern kompetanse og ekspertise innen maskinlæring på feltet kredittrisiko-modellering, forteller Rogelio Andrade Mancicidor i Santander Consumer Bank.

At maskinlæringsgruppa ved UiT er svært aktiv både i Norge og i utlandet og har gjort seg bemerket i andre maskinlæringsmiljøer, var årsaken til at banken ble oppmerksom på gruppa.

– Det er en unik forskningsgruppe i Norge som har fokus på ulike maskinlærings-algoritmer og metodikker. Derfor tok vi kontakt med gruppeleder Robert Jenssen for å starte forskningsprosjektet, sier Mancicidor.

– Santander tok kontakt med oss fordi de som alle andre banker gjerne vil vite mer om risikoen knyttet til utlån. Ingen banker ønsker å gi lån til noen som ikke kan håndtere nedbetalingen. Banken har allerede modeller i dag som kan fortelle noe, men ønsker en enda grundigere vurdering, forteller førsteamanuensis og leder for maskinlæringsgruppa, Robert Jenssen.

Han mener samarbeidet er nyttig for begge parter.

– Maskinlærings-feltet drives framover når vi løser reelle problemer. Det er også et felt med konstante forandringer som vi som forskere må henge med på. Derfor er det nyttig å samarbeide tett med andre aktører, mener Jenssen.

Maskinlæring er allerede noe vi bruker og har nytte av, men de færreste er klar over det. Illustrasjon: Colourbox

Maskinlæring bak Siri, Amazon og Netflix

Maskinlæring er et nytt forskningsfelt, men det er i voldsom utvikling og blir stadig viktigere for samfunnet. Faktisk er maskinlæring noe vi alle allerede bruker og har nytte av, men de færreste er klar over det.

Maskinlæring, som er tett knyttet til kunstig intelligens, har blant annet revolusjonert teknologi som ansiktsgjenkjenning, talegjenkjenning, bildeanalyse, maskinoversetting og e-postfiltre.

Har du iPhone så har du kanskje benyttet deg av Siri, talegjenkjenningsprogrammet som gir relevant tilbakemelding på det du spør om. Siri benytter seg av oppslagsverk på internett, og lærer etter hvert som du benytter deg av tjenesten – alt for å gi deg enda bedre brukertilpassede tilbakemeldinger.

Eller du har kanskje logget deg inn i internettbutikken Amazon eller video- og strømmingstjenesten Netflix. Da har du nok opplevd at disse tjenestene foreslår stadig nye bøker og filmer du kan se – og mange ligner søk du allerede har foretatt. Det er avanserte analyseteknikker og maskinlæring som ligger bak også her.

Maskinlæringsfeltet har røtter tilbake til 60-70-tallet og forskning på mønstergjenkjennelse, men det var først på 90-tallet feltet begynte å utvikle seg i den retningen vi ser i dag.

Se også: Hvem påvirker ditt valg av underholdning?

Etterligner hjernens prosesser

Men hva er maskinlæring?

– Du kan sammenligne maskinlæring med hjernen vår – som er det ultimate maskinlæringssystemet. Fra vi er født får vi begrep om omverdenen gjennom sansene, og underveis forteller også andre mennesker oss hva vi opplever, forklarer Robert Jenssen.

Barn som ser en katt får beskjed av foreldrene at det er en katt, og neste gang de ser en katt har de fått mer begrep om hva det er. Helt til de ser en hund, og må lære seg at det er noe annet enn en katt. Etter hvert kategoriserer hjernen informasjonen, slik at barnet erfarer hva som er hund, katt eller noe annet.

– Dette er ikke ulikt måten maskinens systemer lærer, men i stedet for bearbeide informasjon gjennom neuroner og synapser, så benytter vi tall. Svært forenklet kan man si at hunder representeres med kategorien 1 og katter med kategorien 2. Når datamaskinen blir presentert for et bilde av en hund, så skal den – ved å bearbeide bildet (som består av tall) – komme fram til at bildet svarer til kategorien 1, altså en hund. Ved hjelp av mye justering så lærer maskinen etter hvert å gjøre stadig mer komplekse oppgaver, forteller Jenssen.

Hjelper kreftpasienter

Maskinlæring er tett knyttet til kunstig intelligens, og er i voldsom utvikling. Illustrasjon: Colourbox

Maskinlæring kan brukes innen flere forskningsfelt: innen biologi kan det benyttes til å kartlegge genomet, innen fiskeri  kan det bidra til bedre forvaltning, og beregninger innen klimaforskning.

Det kan også benyttes innen helseforskning for å forutsi sykdom. I dag gjør Maskinlæringsgruppen ved UiT analyser i samarbeid med Gastroavdelingen ved Universitetssykehuset Nord-Norge (UNN) og Nasjonalt senter for E-Helseforskning. Her prøver man å finne ut hvilke pasienter som har størst risiko for komplikasjoner etter kreftoperasjoner i magen.

Hensikten er å forutsi hvilke pasienter som er i risikosonen for visse typer bivirkninger og tilbakefall. Men det er et enormt materiale å forholde seg til, både blodprøver og journaltekst må gjøres om til tall før man kan begynne å lete etter mønstre. Hver pasient kan representeres med 10 000 tall. Har man 10 000 pasienter, så sier det seg selv at det blir et stort tallmateriale.

– Men det bør være stort for at vi skal ha et godt grunnlag for å finne mønstre, sier Jenssen.

Har gjort seg bemerket

Maskinlæringsgruppa består av flere ph.d-studenter, postdoktorer og en rekke masterstudenter. De siste årene har de gjort seg bemerket innen maskinlæringsfeltet gjennom en rekke internasjonale forskningspriser.

Maskinlæringsruppa har også fått FRIPRO-midler fra Norges forskningsråd for å  utvikle grunnforskningsprosjektet Next Generation Learning Machines.

– Innen maskinlæring er det kort vei fra grunnforskning til anvendt forskning og noe som faktisk kan brukes, sier Jenssen, og legger til: 

– Vi blir jo veldig glade når noe av det vi gjør kan benyttes.

Populært blant studenter

Den store interessen for maskinlæring i samfunnet gjenspeiler seg også blant studentene, der Institutt for fysikk og teknologi sitt maskinlæringkurs på masternivå er blant de største.

Studentrekrutteringen til det mest relevante studiet, nemlig sivilingeniørstudiet i Anvendt fysikk og matematikk med studieretning Maskinlæring og statistikk, er også veldig god.

Les mer: Algoritmer styrer din hverdag

 

Solhaug, Randi Merete
Publisert: 10.06.16 00:00 Oppdatert: 10.06.16 10:15
Vi anbefaler