Korleis kan KI hjelpe oss å forstå jorda betre?

I klima- og miljøvitskapen modellerer ein særs komplekse system og handsamar enorme mengder data. Kunstig intelligens (KI) kan hjelpe forskarar forstå jorda betre, men som med all ny teknologi finst det risiko. Korleis bør vi bruke KI?

Ei illustrasjon av jorda bak eit slags platå med fjell, skog og elv.
Med gode nok instrusjonar og kunnskap om fysikkens lovar, kan KI produsere detaljerte og overtydande bilete av ikkje-eksisterande verder. Forfattaren laga dette biletet med ChatGTP-4 og Dall-E. Foto: Bilde er laga ved hjelp av KI (ChatGPT-4 og Dall-E).

KI har vorte eit moteord dei siste åra. Spesielt genererande modellar som ChatGTP og Stable Diffusion har fått mykje merksemd i det siste. Det har aldri vore enklare å lage «kunst» (om KI-generert kunst kan kallast «ekte» er ei pågåande diskusjon), skrive kronikkar eller svare på e-post.

Kunstig intelligens fann vegen inn i anvend vitskap for fleire år sidan, og mange forskarar har allereie tatt i bruk maskinlæring, ei undergrein av KI, utan å vere klar over det. Forskingsfeltet på KI og maskinlæring er breitt og går stadig framover, med ei rekkje bruksmåtar i miljø- og klimavitskap. Då snakkar vi om så ulik bruk som prognosar for tidsseriar eller romlege felt, rekonstruksjon av historiske observasjonar, forbetring av modellar eller førehandsprosessering av data til programmering eller oppsummering av forskingsartiklar.

Å sjå framover i tid

Stort sett er vi interessert i framtida: vêret i morgon, eller klimaet om tusenvis av år. Tradisjonelt sett har vi støtta oss på numeriske modellar for å gjere prognosar for vêr og klima. Numeriske modellar er basert på grunnleggjande fysiske prinsipp og kan produsere nøyaktige resultat – stort sett. Men det er ofte særs dyrt å køyre modellane. I dei siste åra har KI-modellar vist seg å prestere like bra – eller til og med betre – enn dei klassiske modellane.

Til dømes har generative modellar vist at dei kan føreseie nedbørsfelt med gode resultat, til og med betre enn klassiske vêrmodellar. Echo state-nettverk (ein type nevrale nettverk) kan føreseie starten på monsuntida betre enn andre modellar. Maskinlæring oppdaga koplingar mellom hendingar med ekstremnedbør over heile kloden, og kan melde variasjonane i El Niño-effekten.

Å sjå bakover i tid

I tillegg ti prognosar, har KI rekonstruert manglande historiske klimadata. Historiske data er nesten ikkje-eksisterande frå før større observasjonsnettverk vart etablert midt på 1900-talet. For nokre observasjonsobjekt (t.d. temperatur eller nedbør) har vi berre data for nokre få år. Utan kunnskap om fortida kan vi ikkje talfeste historiske endringar, noko som gjer det endå vanskelegare å føreseie framtida.

KI-modellar er trente på resultat frå klimamodellar og kan rekonstruere spatiale eller temporale data om variablar frå røynda. Med andre ord, KI-modellen lærar frå klimamodellen og kan bruke dei dataa i den verkelege verda. KI-modellar har prestert betre enn fleire mykje brukte modellar i geovitskapen. Men det er eit ibuande problem at vi ikkje kan verifisere resultata med observasjonar, sidan det er dei vi vil lage i utgangspunktet. Men vi kan samanlikne modellane med kjende historiske hendingar.

Fleire historiske hendingar førte til tørke, dårlege avlingar, og hungersnaud. Eit døme er den varme fasen av El Niño, som har eit tydeleg avtrykk i overflatetemperaturen i Stillehavet. I åra 1876–1877 førte El Niño til dei mest dødelege hungersnøda i det 19. hundreåret.

Likevel har vi berre svært sparsame observasjonar av overflatetemperaturen frå den tida. Medan mykje brukte statistiske metodar ikkje er i stand til å rekonstruere mønstra av El Niño i 1876/77, avslører ein rekonstruksjon med maskinlæringsmodellar det uvanleg varme Stillehavet i den perioden.

Å spare superdatamaskintid

Det gå òg føre seg ein aktiv innsats for å utnytte og kombinere fordelane med maskinlæring med klassiske jordsystemmodellar. Desse klimamodellane er ekstremt tunge å berekne, og kan ofte ikkje rekne lenger enn nokre få hundreår inn i framtida, og sjølv då berre med låg oppløysing på nokre hundre kilometer.

Ei enkel simulering med ein toppmoderne klimamodell for eit hundreår kan ta fleire veker eller månader på ein superdatamaskin. Likevel treng vi ofte det ein kallar ensemble av simuleringar – mange simuleringar frå same modell – for å gjere statistiske analysar og forsikre oss om at vi ikkje ved tilfelle får ein simulering i den ekstreme enden av alle moglege utfall. Klimamodellar viser det vi kallar intern variabilitet, som er den naturleg førekomande variasjonen i ulike tidsskalaer og jordas naturleg kaotiske vêr- og klimasystem.

Medan KI-modellar ofte treng svært tidskrevjande fininnstilling og trening, kan dei generere resultat mykje raskare enn klassiske modellar når dei er ferdig trente. Det gjer det mogleg for oss, i prinsippet, å køyre store ensemble-simuleringar med høgare oppløysingar.

Per i dag har vi dei første prototypane av hybride jordsystemmodellar, og dei første validerte modellane er venta dei neste åra.

Truverd og "forklarbarheit"

Eit av dei største spørsmåla som bruk av kunstig intelligens stiller i klimavitskapen, er den fysiske truverdet til desse modellane. Korleis kan vi forsikre oss om at resultata gir meining på ein fysisk måte?

Klassiske numeriske modellar er styrte av fysikkens lover, ofte differensiallikningar som bevarer storleikar som energi eller rørslemengd. Vi kan, i teorien, forstå resultata og forklare dei på ein fysisk måte. Likevel er maskinlæringsmodellar ofte ikkje fysisk avgrensa eller forklarlege.

Til dømes har diffusjonsmodellar (KI-system som lagar bilete) problem med å generere menneskehender. Dei drøymer ofte om meir enn fem fingrar om vi ber dei generere ei menneskehand. Medan det er enkelt for oss å sjå sju fingrar som ikkje overtydande, er ikkje feil like openberre i komplekse fysiske system som klimasystemet til jorda.

Nylege forsøk prøver å inkludere fysiske avgrensingar i maskinlæring for å oppnå det som vert kalla fysikkinforma nevrale nettverk. Der vert modellen straffa for å generere "ufysiske resultat". Men det er ikkje alltid enkelt eller gjennomførleg å fysisk avgrense ein modell.

"Forklarbarheita" til KI-modellar er eit anna spørsmål. Ofte veit vi ikkje korleis modellane oppnår resultata. Det er viktig å forstå kvifor modellen oppfører seg som den gjer, særleg når resultata er uventa. I konteksten av vêr og klima treng vi pålitelege resultat som vi kan kommunisere med visse til allmenta og politiske avgjerdstakarar, og det er difor forklarbarheit er så viktig.

Spare tid for forskarar?

I tillegg til direkte bruk i forsking, kan KI-verktøy òg auke produktiviteten til vitskapsfolk. Til dømes kan verktøy som ChatGPT og GitHub Copilot vere overraskande effektive for å skissere og forbetre kode, så lenge instruksjonane er klare. Forskarar, som ofte lærer seg programmering sjølve, kan særleg ha nytte av slike verktøy. Desse modellane kan betre kvaliteten på koden deira og spare dei for tid som kunne vore betre brukt på andre oppgåver.

KI-modellar er i stand til å forstå lange artiklar når travle vitskapsfolk ikkje har nok tid til å lese dei, og dei kan til og med formulere e-postar når vi slit med å finne dei rette orda. Men kvifor er desse modellane så effektive? Ofte er dei trente på massive datasett – titals eller til og med hundrevis av terabyte med data – og det er ikkje alltid tydeleg om opphavsrettane til eigarane vert respektert. Dette problemet vert ofte ignorert, men det bør vi ikkje gløyme.

Vidare kan desse modellane gi feil svar eller resultat som berre kan identifiserast som feile av folk med ekspertkunnskap. Blind tillit til modellresultat kan gjere betydeleg skade på vitskapssamfunnet og allmenta. Det har vore fleire tilfelle av KI-generert innhald i vitskaplege artiklar.

I beste fall kan KI føre til ingen eller berre mindre unøyaktigheiter, medan det i verste fall kan det resultere i falske utsegn i vitskaplege artiklar, basert på feilaktige og ikkje-verifiserte utdata frå KI-modellar.

Difor forbyr dei fleste forlag bruk av store språkmodellar for å skrive vitskaplege artiklar, og det med rette.

Utsyn

Medan KI kan vere eit utruleg verdifullt verktøy for forskarar, som aukar vår forståing av jorda og gjev auka produktivitet, er det ikkje eit universalmiddel. Uvettig bruk av KI kan ha negative konsekvensar for både vitskapen og samfunnet.

Ei KI-teneste vart nytta for å hjelpe til med omsetting av denne saka.

Opprinnelig publisert i: Fram Forum
Portrettbilde av Bochow, Nils
Bochow, Nils nils.bochow@uit.no Stipendiat
Publisert: 26.04.24 13:46 Oppdatert: 26.04.24 14:02
Opprinnelig publisert i Fram Forum
Innlegget er en del av UiT sitt Forskerhjørne, hvor forskere ved UiT formidler sin egen forskning.
Forskerhjørnet Klima Teknologi
Vi anbefaler