Debatt ● Rune Johan Krumsvik

KI er svaret — hva var spørsmålet?

Hva viser forskningen rundt ChatGPT og GPT-4? Hvorfor presterer GPT-4 overraskende bra på en norsk medisineksamen? Og hvorfor har pedagogiske grunnpilarer fått sin renessanse med kunstig intelligens sin inntreden?

Informatics workshop at university. Rear view of students sitting and listening in lecture hall doing practical tasks on their laptops.
Publisert Sist oppdatert

Denne teksten er et debatt­inn­legg. Inn­holdet i teksten uttrykker forfatterens egen mening.

Slike perspektiv blir løftet frem i en ny bok om kunstig intelligens (KI) og som tar «tempen» på dette teknologiske paradigmeskiftet vi står midt oppe innen utdannings- og helsesektoren. Her belyses både muligheter, utfordringer, dilemma og risiko som trer frem i denne brytningstiden som følge av kraftige digitale verktøy med KI «under panseret».

Vi finner at her til lands er det nå nødvendig at man beveger seg fra hverdagsdiskursen rundt de store språkmodellene som ChatGPT og GPT-4, til en mer substansiell analyse rundt hva disse faktisk er kapable til. Det generelle kunnskapsgrunnlaget rundt KI blir derfor adressert ved at internasjonale funn rundt KI generelt, ChatGPT og GPT-4 blir løftet frem. 

Samtidig finner man at her til lands er kunnskapsgrunnlaget mangelfullt, samt at KI-bruk i skolen har siden 2015 gått litt «under radaren». Det er også slik at siden kunnskapsgrunnlaget er tilbakeskuende i sitt vesen, har det vært nødvendig å foreta noen nye kunnskapsoppsummeringer rundt ChatGPT og GPT-4 i boken. I tillegg har det også vært nødvendig å foreta en relativ omfattende utprøving av den kraftige språkmodellen GPT-4 i løpet av den tiden den har vært tilgjengelig for folk flest. Dette har skjedd gjennom testing og utprøving av GPT-4 over 6 måneder, hvor utprøving av dens kapabilitet på blant annet norske medisineksamener (6. året) og innen andre fag, har vært en del av prosessen. 

Det har vært meningsfylt å gjøre dette for å se hvor kapabel GPT-4 er på norsk rundt mer avanserte akademiske og forskningsmessige kontekster. For å sjekke om en del «barnesykdommer» hos GPT-4 er på hell, har man også reanalysert nesten førti temaer fra en stor internasjonal utprøvingsstudie som brukte en tidlig versjon av GPT-4, for å se om den har «modnet» i løpet av åtte måneder. Sentralt her har vært å se på om GPT-4 projiserer fordommer og feilinformasjon til brukerne, siden både ChatGPT og en tidlig versjon av GPT-4 har vist seg å inneha noen kjente kjønns- og klassestereotypier, samt diskriminerende aspekt.

Til sammen har alt dette gitt et godt bilde av hva GPT-4 (versjon august 2023) er kapabel til som en kognitiv teknologi på en rekke områder, samt om den mestrer norskspråklige eksamensoppgaver like godt som engelskspråklige.

Selv med litt forsiktighet kan flere av funnene i boken karakteriseres som såpass banebrytende at vi kan snakke om et teknologisk paradigmeskifte. Den presterer svært bra på både medisineksamener internasjonalt, samt nasjonalt på en av de mest krevende skoleeksamenene på medisinstudiets sjette år. De mulige årsakene til dette blir grundig drøftet og analysert i boken i lys av både maskinlæringens vesen, intelligente veiledningssystem og læringsanalyse.

Men hvilke implikasjoner får dette for praksis? I boken viser man for eksempel hvordan anonymiserte, autentiske pasientdata fra laboratorier blir analysert og fortolket av GPT-4 på en oppsiktsvekkende treffsikker måte. Det blir også løftet frem at i studiehverdagen for studenter kan dette paradigmeskiftet utspille seg ved at medisinstudent Vegard Slettvoll, UiB anvender ChatGPT hyppig som en «sparringpartner», en som «ser deg over skulderen» og en «lærerassistent» som er tilgjengelig 24/7. Han anvender den til å simulere caser fra eksamensoppgavesettene og kan dermed få (sammen med andre læringsressurser) god mengdetrening i pasientcaser som forberedelse til eksamen, praksisperioder og etter hvert som nyutdannet lege. 

Flere pedagogiske grunnpilarer kan få sin renessanse som følge av KI-teknologi som GPT-4, men dette også krever en nytenkning rundt vurderingsformene.

Rune Johan Krumsvik

Under den nasjonale konferansen om Digitalisering i høyere utdanning 2023, 1. november, nevnte Slettvoll at språkmodellene tar simulering og studentaktiv læring til nye høyder, og at dette trolig vil transformere høyere utdanning i årene som kommer. Dette er noe som jeg også ser konturene av i boken min ved at flere pedagogiske grunnpilarer kan få sin renessanse som følge av KI-teknologi som GPT-4, men at dette også krever en nytenkning rundt vurderingsformene.

Selv om GPT-4 også er svært kapabel til å håndtere Ludwig Wittgenstein’s språkspill i nærmest hvilken som helst språklig kontekst, så er det også her slik at «som man roper i skogen, får man svar». Hos GPT-4 får dette en dobbel klangbunn ved at den selvsagt klarer å gjøre rede for dette ordtaket, men viktigere — man får svar som passer presisjonen til ens eget spørsmål. Er dette vagt og upresist får man «svar på tiltale» fra GPT-4 og ofte en generell respons. Så ønsker man mer substansielle og presise svar på forespørsler, legger man mye av premissene for dette selv ved presise forespørsler, spesielle script, o.l.

Samtidig fordrer alt dette at man må ta stilling til en rekke utfordrende spørsmål i tiden fremover når det gjelder KI; Er KI et etisk minefelt med en «målet helliger middelet»-retorikk eller er EUs KI-regulativ nøkkelen her? Vil EUs AI-regulativ tillate å la KI bruke pasientdata og registerdata som treningsgrunnlag? Og hva skjer når store forlagene fusjonerer med KI-aktører (slik man har sett med storforlaget Wiley og KI-aktøren Knewton)? Vil forlagskatalogene da bli en del treningsgrunnlaget til KI? Hva så med opphavsrettighetene til forfatterne? Og hva skjer om, og evt. når KI trenes på utdanningssektorens registerdata? Og «møter vi oss selv i døren» ved at ChatGPT og GPT-4 på enkelte felt har skyggesider, for eksempel omkring stereotypiske oppfatninger, som egentlig er generert gjennom våre egne tekster som GPT-4 er trent ut fra?

Som man skjønner, er det mange forhold man må ta hensyn til fremover og tenke nøye igjennom. Mye tyder på at KI og de store språkmodellene er en lakmustest» på hvordan vi tenker oss utdannings -og helsesektoren fremover og det trengs derfor både god digital kompetanse, kritiske perspektiv og et bedre kunnskapsgrunnlag for å kunne navigere stødig i dette komplekse terrenget i årene fremover.

Powered by Labrador CMS