Debatt ● Fem språkteknologer ved Universitetet i Oslo

Vi trenger mer forskning på språkmodeller i Norge

Den akademiske forskningen på språkmodeller representerer på mange måter en motvekt til de store kommersielle selskapene.

Hvordan skal Norge forholde seg til bruk av språkmodeller?
Publisert Sist oppdatert

Denne teksten er et debatt­inn­legg. Inn­holdet i teksten uttrykker forfatterens egen mening.

I sitt innlegg «Nå er det nok. Stopp bruken av kunstig intelligens til kunnskapsarbeid» i Aftenposten nylig kritiserer Jill Walker Rettberg bruken av språkmodeller (såkalt «generativ KI») til kunnskapsarbeid og mener Norges digitaliseringsstrategi er feilslått når den har som mål at 80 prosent av offentlig sektor skal ta i bruk KI. 

Begrunnelsen er at språkmodeller gjør graverende feil, forsterker fordommer og virker fordummende på brukerne. 

Som forskere på språkmodeller er vi godt kjent med disse utfordringene og deler Rettbergs bekymring. Ukritisk, uinformert eller unødvendig bruk av KI er problematisk på mange måter. 

KI-feltet domineres av de store teknologigigantene med solide PR-budsjetter og språkmodeller er en teknologi det har vært festet enorme og til dels urealistiske forventninger til. Det er mange bruksområder der det er yrkesfaglige og etiske grunner til å ikke stole på KI. Samtidig ser vi at begrensninger i teknologien ofte også forsterkes av mangelfull kompetanse og kunnskap på brukersiden. 

Hvordan skal så Norge forholde seg til bruk av språkmodeller? Digitaliserings­minister Karianne Tung ønsker å øke bruken i offentlig sektor. Rettberg mener de overhodet ikke bør brukes til kunnskapsarbeid. 

Vårt svar er at vi må styrke forskningskapasiteten på språkmodeller i Norge for å kunne belyse muligheter og utfordringer i en norsk kontekst. 

Språkteknologi er et felt der utviklingen går i et rasende tempo. Den akademiske forskningen på språkmodeller representerer på mange måter en motvekt til de store kommersielle selskapene. 

Fokuset er på såkalt åpne modeller. Dette er modeller som kan deles og brukes fritt, og har dokumentasjon på hvilke data de er trent på. ChatGPT og andre kommersielle språkmodeller oppfyller ingen av kriteriene til åpenhet. Fordelene med åpne modeller er mange. De kan lastes ned og brukes lokalt, uten å måtte sende fra seg data til utenlandske selskaper, og kan tilpasses spesialiserte oppgaver for bedre ytelse. 

De store kommersielle modellene er i hovedsak trent på engelskspråklige data, der norske data kun utgjør en promille. At norsk språk og kultur i liten grad er representert gjenspeiles naturlig nok i modellenes norskkunnskaper. Språkrådet sammenlignet nylig tekst generert av ChatGPT og en betydelig mindre norskutviklet modell, og fant at den hjemlige varianten skrev bedre norsk. 

Samtidig er det mange brikker som gjenstår for å sikre konkurransedyktig ytelse for de norske modellene på tvers av ulike oppgaver og bruksområder. Evaluering, altså systematisk testing av modellene for å avdekke feil og mangler, er i seg selv et viktig forskningsfokus. 

Tilgang på åpne norske språkmodeller er også en viktig brikke for å sikre vår digitale suverenitet og selvråderett. 

Da KI-gudfaren Yoshua Bengio besøkte UiO denne uken var han klar i sin tale: Norge bør satse på kontroll av egne modeller. Og for at disse modellene skal være konkurransedyktige må det satses betydelig på forskning. I det nasjonale KI-landskapet er det dessverre slik at forskning på språkmodeller i dag knapt er dekket. 

Ingen av de seks KI-sentrene som fikk sin tildeling før sommeren har fokus på språkmodeller og den finansieringen som er gitt til språkmodellutvikling i Norge prioriterer ikke forskning på området. I årene framover trenger Norge derfor en langsiktig, nasjonal satsing på språkteknologisk forskning og kompetansebygging. 

Powered by Labrador CMS