Debatt ● Kine M.D. Maxwell
Keiseren i Orwells speil: KI og vurderingens dobbelttenk
Kunstig intelligens har blåst litt liv i diskusjonen om vurdering. Frykten for å miste kontroll har vokst frem som den styrende kraft — i stedet for å spørre hvordan teknologien kan berike læringen, spør vi hvordan vi kan beskytte vurderingen mot den.

Denne teksten er et debattinnlegg. Innholdet i teksten uttrykker forfatterens egen mening.
Hos H.C. Andersen vet alle innerst inne at keiseren er naken, men de deltar likevel i illusjonen fordi det er lettere å late som enn å risikere å stå utenfor. Eventyret handler om sosial konformitet og frykten for å utfordre en etablert sannhet.
I høyere utdanning finnes et lignende selvbedrag. Vi later som om vurderingene våre måler læring, selv om vi vet at de ofte ikke gjør det. Vi snakker om kvalitet og integritet, men unngår å definere hva det faktisk betyr. Vi ser svakhetene i systemet, men tier.
Å påpeke at keiseren har rompa bar vil bare medføre mye styr, merarbeid og etablering av arbeidsgrupper.
Denne stillheten leder tankene mot Orwells begrep «dobbelttenk»: evnen til å holde to motstridende tanker i hodet samtidig, og tro på begge. I vurderingskulturen viser denne motsetningen seg tydelig. Vi sier at vurdering skal støtte læring, men utformer den for å sortere og kontrollere. Vi sier at vi stoler på studentene, men opprettholder systemer som skal sikre oss mot feil og misbruk.
Slik opprettholdes en praksis alle vet er selvmotsigende, men ingen vil ta i.
Kunstig intelligens har blitt barnet i eventyret, den som peker og sier det vi allerede vet: Keiseren er naken. Debatten etter de store språkmodellenes inntog har i stor grad handlet om juks, mistenksomhet og teknologisk kontroll.
Å påpeke at keiseren har rompa bar vil bare medføre mye styr, merarbeid og etablering av arbeidsgrupper.
For all del, vi er ikke fremmede for å løsne litt på slipset og la studentene drodle med språkmodeller underveis i kursene sine — men når det kommer til vurdering? Absolutt ikke!
I vurderingssituasjonen etterstreber vi autentisitet, den ekte og ubesudlede læringen, den som finnes et sted der KI ennå ikke har kommet til. For hvordan skal vi ellers kunne gå god for at studentene faktisk har lært noe? Denne motsetningen mellom daglig praksis og eksamenslogikk sier mye om hvordan vi forstår autentisitet.
Men KI i seg selv er ikke vurderingens fiende. KI er bare speilet som viser at vurderingssystemet allerede sto på vaklende grunn.
Når vi reagerer med utestemme og flere regler og intrikate retningslinjer, avslører vi at vi mangler svar på de mest grunnleggende spørsmålene: Hvorfor vurderer vi? For hvem? Og hva er det vi egentlig verdsetter?
Vurdering er trolig et av de seigeste feltene i høyere utdanning når det gjelder endringsvilje. Deneen og Boud (2013) beskriver dette som epistemisk motstand — et ubehag som oppstår idet man tvinges til å spørre hva vurdering egentlig skal være til for. Flere studier peker på det samme: vurderingskulturen i høyere utdanning preges av treghet og svak refleksjon over formål og hensikt (for eksempel Simper et al., 2022).
Mange institusjoner fortsetter å følge regler og rutiner av gammel vane — de måler, registrerer og kontrollerer — uten å stille spørsmålet om hva vurderingen egentlig skal tjene.
Som Morten Breivik og hans kolleger påpekte i høst, har universitetet lenge vært preget av et system som «siler, tester og akkrediterer». Kanskje er det nettopp derfor språkmodellene skaper så mye uro: de utfordrer et vurderingsregime som i større grad har handlet om kontroll enn om læring. Det er enklere å justere prosedyrer, verktøy og format enn å diskutere formål og hensikt.
I stedet for å spørre hvordan vurdering kan støtte læring, spør vi hvordan vi kan beskytte den mot KI. To helt forskjellige samtaler.
Samtidig ser vi at studenter underrapporterer hvor mye de faktisk bruker KI. I en studie ved University of Chicago oppga 60 prosent at de selv brukte KI, men trodde at 90 prosent av medstudentene gjorde det (Imas & Ling, 2025). Forskerne forklarer gapet med sosial ønskverdighet.
Når åpenhet kan straffes, velger studentene stillhet. Og hvordan kan vi forstå eller forbedre vurdering når praksisene holdes skjult?
Studentene er redde for å innrømme KI-bruk fordi de frykter negative reaksjoner. Det sier noe vesentlig om klimaet i høyere utdanning. Når åpenhet kan straffes, velger studentene stillhet. Og hvordan kan vi forstå eller forbedre vurdering når praksisene holdes skjult?
Studentene ser det vi ikke vil se. De beskriver hvordan hjemmeeksamener nå ligner «tester i KI-kamuflasje». De etterlyser vurderingsformer som speiler læring — som tester forståelse, dømmekraft og evne til å tenke selv.
Kort sagt: De ber oss gjøre jobben vår.
Luth-Hanssen og Raaheim minner oss om at kognitiv anstrengelse er kjernen i livslang læring. Uten motstand, uten tenkning, oppstår ingen dyp forståelse. Det gjelder også vurdering.
Når både undervisere og studenter søker snarveier — de første etter mer effektive målemetoder, de siste etter raskere svar — forsvinner læringens substans. KI kan støtte refleksjon og dialog, men den kan ikke erstatte innsats, ansvar og intellektuell motstand. De peker også på at kritisk refleksjon ikke kan kreves fram; den må springe ut av eierskap. Når studentene deltar i vurderingsprosessen, lærer de. Når de bare blir vurdert, lærer de å unngå feil.
Et klima av mistillit og kontroll skaper strategisk atferd, ikke læring.
Om man velger skoleeksamen, muntlig eksamen eller KI-støttede løsninger, spiller ingen rolle. Vurderingsformen må speile læringsprosessen, ikke vår frykt for å miste kontroll.
KI har ikke skapt krisen i vurdering, den har bare gjort den mer åpenbar. Den har røsket buksene av keiseren og etterlatt oss med det ubehaget vi lenge har forsøkt å skjule.
I møtet med teknologien avsløres et selvbedrag: Vi snakker om læring, men handler for kontroll. Vi hyller åpenhet, men straffer ærlighet. KI er både speilet og barnet i eventyret — den som viser at keiseren er naken.
Og som hos Orwell, holder vi to motstridende sannheter i hodet samtidig. Dobbelttenkingen er ikke ny — men KI gir oss et påskudd til å se nærmere på den. Vi burde i det minste våge å utforske tanken på at vurdering kan forstås og praktiseres annerledes.
Vi kunne forsøke å følge resonnementet et lite stykke videre før vi avviser det. Vi får neppe tankepolitiet på døra.