Språkmodeller
Samler norsk språkmodell-forskning i ny nasjonal klynge
Informatikk-professor Stephan Oepen er valgt som leder for Språkmodellklynge Norge. På agendaen står blant annet en mer koordinert og forpliktende nasjonal satsing på store språkmodeller.
— Vi hadde et virkelig bra møte her på huset, sier informatikk-professor ved Universitetet i Oslo, Stephan Oepen, til Khrono.
Torsdag samlet Nasjonalbiblioteket, NTNU og Universitetet i Oslo forskere og samarbeidspartnere til et heldagsseminar i hovedstaden, som markerte oppstarten av et nytt initiativ for nasjonal koordinering av forskning på store språkmodeller (LLM-er).
Der ble blant annet navnet på det nye initiativet bestemt, Språkmodellklynge Norge, og det ble også avgjort at Stephan Oepen skal lede initiativet i dets første år.
Bak initiativet står de tre ledende norske fagmiljøene på området, nemlig Nasjonalbiblioteket (NB), NorwAI-senteret ved NTNU og Språkteknologigruppen (Language Technology Group, LTG) ved Universitetet i Oslo. Også Sigma2 og Språkrådet deltar i arbeidet.
— Flere andre aktører kan bli koblet på etter hvert, sier Stephan Oepen.
Fragmentert norsk forskningslandskap
Ifølge partene selv kommer initiativet som et svar på et fragmentert norsk forskningslandskap innen store språkmodeller. Samtidig preges feltet internasjonalt av rask utvikling og sterk dominans fra store teknologiselskaper, særlig i USA og Kina.
I avtalegrunnlaget for initiativet pekes det på at både teknologi og tjenester i dag i stor grad styres av kommersielle aktører og domineres av språk med mange brukere.
— Vi er enige om at det er et skrikende behov for bedre koordinering av FoU på språkmodeller i Norge, samt at kunnskapsgrunnlaget og FoU-kapasitet må styrkes betydelig i en nasjonal tilnærming, sier Stephan Oepen til Khrono.
Sammen med resten av Språkmodellklynge Norge mener han at forskning er avgjørende for at Norge skal holde følge. Han viser til at Stortinget allerede har vedtatt nasjonale strategier og satsinger på kunstig intelligens, blant annet for å motvirke internasjonal dominans.
— Likevel vurderer aktørene bak initiativet at forskning på språkmodeller i liten grad er dekket av eksisterende ordninger, poengterer Oepen.
Digital suverenitet
I klyngens avtaletekst heter det at åpne, egenutviklede norske språkmodeller er viktige både for språklig og kulturell identitet og for digital suverenitet og samfunnets motstandskraft.
Samtidig advares det mot at det kan oppstå en «tørke» i norsk LLM-forskning, ettersom feltet verken inngår i porteføljen til KI-sentrene som ble etablert i 2025 eller i andre pågående satsinger.
De tre institusjonene foreslår derfor en mer koordinert og forpliktende nasjonal satsing. På sikt skal hver av dem sette av egne forsknings- og utviklingsmidler til samarbeid, men i avtalen understrekes det at et større og mer formalisert samarbeid forutsetter betydelig ekstern forskningsfinansiering.
Rollene i samarbeidet er også tydelig beskrevet. Nasjonalbiblioteket har et nasjonalt mandat for datainnsamling og utvikling av språkmodeller til bruk i offentlig sektor og næringsliv, men uten et eksplisitt forskningsansvar på LLM-er. Gjennom samarbeidet skal dette arbeidet kobles tettere til forskningsmiljøene ved UiO og NTNU, samtidig som forskningen kan forankres i konkrete samfunnsbehov.
Arendalsuka
Stephan Oepen forteller litt om planene videre:
— I nærmeste fremtid forbereder vi et «kommuniké», et fremstøt mot relevante beslutningstakere og et arrangement under Arendalsuka, sier han.
Partene har allerede erfaring med samarbeid. I 2024 deltok de i det såkalte Mímir-oppdraget fra Kultur- og likestillingsdepartementet, der norske språkmodeller ble trent og evaluert for å undersøke betydningen av ulike typer treningsdata.
Klyngeavtalen fremhever behovet for langsiktig metodeforskning knyttet til norske språkmodeller, blant annet tilpasning av modellarkitekturer for små datamengder, overføring til mindre språk som nynorsk og samiske språk, samt utvikling av norske evalueringsmetoder.
Som en del av initiativet etableres det nå også en koordineringsgruppe med representanter fra de tre institusjonene. Gruppen skal orientere om pågående og planlagte aktiviteter, diskutere strategi og arbeide for bedre koordinering av forskningssamarbeid og finansiering.
Sigma2 og Språkrådet er pekt ut som faste observatører, og det vil legges opp til samarbeid med samiske forskningsmiljøer ved UiT Norges arktiske universitet og Samisk høgskole.
