Kunstig intelligens
KI-utvalg vil teste bruk av kunstig intelligens i eksamenssensur
Utvalget for kunstig intelligens i høyere utdanning tror KI-sensur kan bli like bra som menneskelig sensur. Det oppfordrer til mer bruk av eksamensformer som kan kontrolleres, som skoleeksamen og muntlig eksamen.
Utvalget for kunstig intelligens i høyere utdanning kommer nå med sine foreløpige vurderinger om kunstig intelligens, eksamen, sensur og begrunnelser.
Det anbefaler mer bruk av kontrollert eksamen, fraråder overvåking på hjemmeeksamen og oppfordrer til bruk av KI-systemer i arbeid med sensur og begrunnelser.
— Hjemmeeksamen uten kontroll ser ut til å være en vanskelig farbar vei videre. Samtidig er det et ganske stort spillerom når det gjelder eksamen, både i hvordan vi kan arbeide med begrunnelser, og på lengre sikt hvordan man kan jobbe med ulike former for automatisert KI-sensur, sier Anders Malthe-Sørenssen, leder av utvalget, til Khrono.
Alle anbefalingene kan leses nederst i saken.
— Jeg forventer at universiteter og høgskoler vurderer bruken av slike verktøy, i lys av den klare anbefalingen fra utvalget. Uavhengig av hvilke verktøy universitetene og høgskolene bruker, må vi være sikre på at vi vurderer studentene på rettferdig vis og at rettssikkerheten til studentene er ivaretatt, sier forsknings- og høyere utdanningsminister Sigrun Aasland (Ap) i en pressemelding.
Vil ha testing av KI-sensur
I sine vurderinger skriver utvalget at det «forventer at det allerede, eller innen kort tid, vil være mulig å utvikle KI-systemer som gjennomfører sensur like godt som fagpersoner.» Utvalget viser til flere studier som har testet bruk av kunstig intelligens i sensurarbeid, med gode resultater.
Videre heter det at utvalget forventer at universiteter og høgskoler legger til rette for å utvikle og teste KI-systemer de kan bruke som hjelpemiddel ved sensur. Når det gjelder begrunnelser, mener utvalget tiden er moden for å teste ut helt automatiserte systemer.
— Hvis man automatiserer sensurarbeid, vil fagpersoner bli overflødige?
— Det finnes så mange faglig viktige oppgaver å jobbe med i sektoren at dersom deler av sensuren blir automatisert, tror jeg dette vil være en relativt liten utfordring. Det vil fortsatt være mange meningsfulle og nødvendige oppgaver å ta tak i, sier Malthe-Sørenssen.
Full automatisering av sensur er ikke uten videre noe man kan få til i dag, mener Malthe-Sørenssen. Han påpeker at i en framtid der automatisk KI-sensur er mulig, vil det fremdeles være viktig å designe gode eksamensoppgaver som tester studentens læringsutbytte. Det vil faglærere fremdeles gjøre.
— Dette er kontroversielt for mange, har utvalget diskutert det?
— Vi sier ikke at dette er situasjonen i dag, men det kanskje kan det bli slik innenfor enkelte fagområder. Vi har ikke veldig mye data, men når vi ser på den tilgjengelige dokumentasjonen vi refererer til, viser den at resultatene fra KI-sensur er omtrent på samme nivå som menneskelig sensur, sier Malthe-Sørenssen, og fortsetter:
— Ja, jeg tenker at det er litt kontroversielt. Samtidig tror jeg det kan være sunt å erkjenne at dette er den retningen KI-systemene beveger seg i.
Fungerer som støtte
Malthe-Sørenssen peker på at kunstig intelligens i første omgang kan fungere som støtte i sensurarbeidet.
— Det er fortsatt slik at vi stiller svært strenge krav til dokumentasjon før et slikt system eventuelt kan tas i bruk til automatisert sensur. Det krever både solid dokumentasjon og svært forsvarlig håndtering av data. Vi er ikke der i dag.
Når det gjelder begrunnelser, anbefaler utvalget at institusjonene tester ut helt automatiserte KI-begrunnelser. Videre skriver utvalget at Universitets- og høgskoleloven åpner for at kunstig intelligens kan brukes som hjelpemiddel, under visse vilkår.
— Det har lenge vært diskusjoner i sektoren om hvorvidt begrunnelser faktisk er pedagogisk nyttige for studentene. Med automatiserte systemer kan studentene bruke dette ikke bare til å få en begrunnelse etter sluttvurdering, men også som en del av selve læringsprosessen, ved å få tilbakemeldinger underveis, sier Malthe-Sørenssen.
Åpent for innovasjon
Det er ulikt hvordan de forskjellige utdanningsinstitusjonene legger opp eksamen. Generelt har det vært en økning i bruk av skoleeksamen og en nedgang i bruk av hjemmeeksamen, viser en kartlegging som Khrono har gjort.
— Fordi spennvidden er så stor, har vi bevisst ikke sagt så mye om hvilke eksamensformer som er riktige. Vi ønsker å holde rommet åpent for innovasjon, samtidig som vi må sikre at vurderingsformene faktisk gjør det mulig å vurdere studentenes læringsutbytte, sier Malthe-Sørenssen.
Utvalget har fem anbefalinger om eksamen.
— Den største utfordringen handler om integriteten i sertifiseringsprosessen. Man kunne tenke seg løsninger som KI-detektorer eller såkalte KI-sikre eksamensformer, og det har vært gjort mye godt arbeid på dette. Men vi anbefaler ikke disse strategiene videre, sier Malthe-Sørenssen.
Årsaken er at verktøy for å fange opp tekst generert av kunstig intelligens, ikke er så veldig treffsikre, og det kan være vanskelig å skille mellom det som er godkjent bruk av KI kontra fusk.
Utvalget anbefaler derimot mer bruk av kontrollert eksamen, for eksempel skoleeksamen, og færre ikke-kontrollerte eksamener, som hjemmeeksamen. Har institusjonene ikke-kontrollerte eksamensformer, bør det også gis kontrollert form for vurdering i faget.
— Det er stort spillerom. Ofte tenker man litt binært, enten hjemmeeksamen der alle hjelpemidler er tillatt, eller skoleeksamen med penn og papir. Men det finnes et stort spenn mellom disse ytterpunktene, sier Malthe-Sørensen.
Mangler hjemmel for overvåking
Videre skriver utvalget at overvåking av hjemmeeksamen ikke er tilstrekkelig hjemlet i dag, og derfor bør det ikke gjennomføres.
Utvalget lister opp risikoene ved slik overvåking: Psykologisk belastning, effekt på eksamensprestasjoner, data på avveie, tekniske feil og praktiske feil ved gjennomføring av eksamen. I motsatt ende kan slik overvåking gi mer effektiv bruk av ressurser, for eksempel at man slipper eksamenslokale, og gjøre det enklere for studenter som bor langt unna studiestedene sine å ta eksamen.
Utvalget har ikke kartlagt utbredelsen av overvåking på hjemmeeksamen.
Oslo Nye Høyskole innførte overvåking av kortere hjemmeeksamen denne høsten, noe som førte til sterke reaksjoner fra studenter og skepsis fra eksperter om hvorvidt det juridiske grunnlaget er godt nok.
Ønsker tilbakemelding
Generelt ser Malthe-Sørenssen veldig optimistisk på utviklingen i sektoren.
— Det er mange som jobber med dette, men samtidig finnes det en bekymring. Hvis man prøver ut noe og gjør noe som viser seg å være uheldig, for eksempel innfører overvåking av studenter på eksamen, kan det slå tilbake på institusjonen, sier han.
Denne frykten kan gjøre at enkeltpersoner, fagmiljøer og institusjoner vegrer seg for å teste nye løsninger.
— Bekymringene kan handle om alt fra personvern og lagring av persondata, til usikkerhet rundt metoder og teknologiske løsninger. Nettopp derfor er det viktig å belyse det juridiske rammeverket tydelig. Det var også noe av målet med notatet som nå er levert, å klargjøre hvilke juridiske rammer som allerede finnes, sier Malthe-Sørenssen.
Det vil ikke komme flere delrapporter før KI-utvalgets utredning skal være klar 1. oktober 2026. Utvalget mente det var viktig å få respons på arbeidet med vurdering og eksamen, og har derfor publisert noen foreløpige anbefalinger.
— Motivasjonen vår for å publisere dette notatet er å gi anbefalinger innenfor områder vi mener er viktige, men også å få tilbakemeldinger på om det er ting vi har oversett, ting vi har vurdert, om det er andre argumenter vi ikke har sett, eller andre argumenter vi burde vektlegge i vurderingene våre, sier Anders Malthe-Sørenssen.
Utvalgets anbefalinger
- Universiteter og høgskoler bør bruke færre ikke-kontrollerte og flere kontrollerte eksamensformer.
- Universiteter og høgskoler bør supplere ikke-kontrollerte eksamener med en kontrollert eksamensdel.
- Utvalget har vurdert et tiltak om å ha mindre summativ vurdering, men anbefaler ikke dette nå.
- Universiteter og høgskoler bør ikke fremover forfølge en strategi om å lage KI-immune eksamensoppgaver.
- Overvåkning av hjemmeeksamen er ikke tilstrekkelig hjemlet i dag, og bør ikke gjennomføres i fravær av det.
- Utvalget fraråder universiteter og høgskoler å bruke KI-deteksjonsverktøy for å identifisere ureglementert bruk av KI-verktøy.
- Utvalget anbefaler universitetene og høgskolene å fortsette sitt arbeid med å videreutvikle sine eksamensregler og retningslinjer for bruk av KI-systemer, støttet av erfaringsdeling og tilbakemeldinger fra studentene.
- Universiteter og høgskoler bør gjøre forsøk med KI-systemer til sensur.
- Utvalget vil i videre arbeid vurdere å anbefale en lovhjemmel for automatisert sensur eller forsøk med automatisert sensur.
- Universiteter og høgskoler bør gjennomføre forsøk med KI-systemer som hjelpemiddel til karakterbegrunnelse.
- Universiteter og høgskoler bør gjennomføre forsøk med automatiserte KI-genererte karakterbegrunnelser.
- Utvalget vil i videre arbeid vurdere å anbefale en lovhjemmel for automatisert karakterbegrunnelse.
- Fagmiljøer og den enkelte faglig ansatte har et ansvar for å utvikle sin fagspesifikke og utdanningsfaglige KI-kompetanse.
- Universiteter og høgskoler har et ansvar for å gi sine faglige ansatte tilbud for å utvikle sin utdanningsfaglige KI-kompetanse, og for å ha tilstrekkelig etisk, juridisk og forvaltningsmessig kompetanse som tilbydere eller anvendere av KI-systemer. Institusjonene bør samarbeide og dele kunnskap.
- Sentrale myndigheter bør støtte institusjonenes arbeid ved å skape plattformer for samarbeid mellom fagmiljøer, erfaringsutveksling og kunnskapsdeling i sektoren.
