Debatt ● Kristin Hagemann
Om menneskespråk og språkteknologi
Mange synes å overvurdere hva språkteknologien kan bidra med, skriver Kristin Hagemann.

Denne teksten er et debattinnlegg. Innholdet i teksten uttrykker forfatterens egen mening.
Vi lever i en tid da store språkmodeller som ChatGPT og liknende er blitt noe vi må forholde oss til enten vi vil eller ikke. Mange synes å overvurdere hva denne språkteknologien kan bidra med, og det kan synes som om noe av grunnen er mangel på kunnskap om hva språk er.
For er det egentlig språk det som kommer ut av modellene?
Språket vårt, det talte, det muntlige, er noe av det som definerer oss som mennesker. Vårt kommunikasjonssystem skiller oss fra alle andre skapninger på denne jorda i det at vi kan uttrykke alt vi tenker. Andre skapninger kan både tenke og kommunisere, bare tenk på kråkers konsekvensberegning og biers dans, men bare mennesker (tror vi i alle fall) er i stand til å koble sammen vår tankeverden med vår kommunikasjon i et tilnærmet én-til-én-forhold.
Denne evnen utviklet vi for mellom 20.000 og 100.000 år siden, og den består av i alle fall to kognitive systemer som hver for seg er så komplekse at vi fortsatt jobber med å forstå dem.
Det ene systemet kobler sammen et konseptuelt innhold og et språklig uttrykk, sånn at hvis jeg sier «tryllestav», så overfører jeg ideen om en tryllestav fra mitt hode til ditt, gjennom å ytre en meningsfull sekvens av lyder som du hører (eller tegn som du ser), som da skaper et tilsvarende konsept i ditt hode. Det konseptuelle innholdet er da ideen om tryllestaven, mens det språklige uttrykket er det ordet jeg brukte. Disse språklige uttrykkene kan blant annet være ting vi omgir oss med (‘bok’), følelser vi har (‘redd’), hendelser vi opplever (‘storm’), handlinger vi har gjort (‘stjålet’) eller ønsker å gjøre (‘bo på Mars’) eller vil at noen andre skal gjøre (‘gå vekk’).
For å uttrykke alle disse mulige menneskelige erfaringene og tenkte scenarioene blir de ulike språklige uttrykkene satt sammen ved hjelp av et system som vi kaller grammatikk, som muliggjør at vi ikke bare deler enkle konsepter med hverandre, men komplekse tankerekker, slik som denne teksten er et uttrykk for.
Hva skjer når noe som likner menneskespråk, men ikke er det, møter oss alle kanaler?
Men språket vårt er ikke bare koding og avkoding av språklige uttrykk og konsepter; vi er også genetisk programmerte til å tillegge vår samtalepartner et sinn som likner vårt eget. Og ettersom vi ofte handler med intensjon, så forventer vi at andre handler med intensjon – vi har en hang til å lete etter hvorfor folk gjør ting. Språket vårt opererer med vår søken etter intensjon som premiss – vi tillegger handlinger en tanke bak, selv når det ikke finnes noen.
Vi er også rigga for å bruke tid og krefter på å skille mellom relevant og irrelevant informasjon fra omgivelsene, og vi oppfatter, ikke overraskende, menneskelig kommunikasjon som relevant. Menneskespråk har dermed en umiddelbar fordel når det gjelder å fange vår oppmerksomhet: hjernen vår er innstilt på at det ligger en intensjon om å informere bak språket og at informasjonen er relevant for oss. Men hva skjer når noe som likner menneskespråk, men ikke er det, møter oss alle kanaler?
Når vi samhandler med store språkmodeller som ChatGPT, er disse ubevisste kognitive prosessene fremdeles i sving. Det betyr for eksempel at vi tillegger språkmodellene evnen til å koble språklig uttrykk (som for eksempel et ord) med innhold (konsept), sånn at når ChatGPT produserer «tryllestav», så føles det som om den også kobler det språklige uttrykket med en konseptuell side, slik som hos et menneske – men det gjør den ikke.
Det er andre mennesker som har sittet og programmert koblinger inne i det nevrale nettverket til de store språkmodellene, men til forskjell fra hos mennesker, består ikke koblingene av uttrykk og konsept, men av oppstykkede uttrykk – tokens – og tall. Så ChatGPT kunne like gjerne spyttet ut en helt tilfeldig sammensatt rekke av tokens hvis den hadde fått beskjed om det, meningsinnholdet for språkmodellen ville vært det samme – nemlig intet.
Det betyr at konsepter som sådan ikke egentlig finnes i den kunstige intelligensen, ikke på den måten vi mennesker har konsepter – noe som i sin tur gjør det rart å snakke om samtalerobotens intelligens. Å erstatte den utsøkt elegante kommunikasjonen som finner sted mellom to mennesker – der et mentalt konsept hos taler blir til språklig uttrykk, som oppfattes av en tilhører og igjen blir til et konsept – med oppstykkede språklige uttrykk, koblet med en rekke intetsigende tallkoder og foret inn i en statistisk modell, framstår i beste fall som en veldig dårlig idé, om det idet hele tatt kan kalles språk. Selv om mange av ordstrømmene kan gi mening for oss, er de ikke i seg selv meningsbærende enheter, det er vi som mottakere som skaper meninga. Er kommunikasjon uten en intendert mening faktisk kommunikasjon?
Er vi i ferd med å delegere vekk til maskiner noe av det som gjør oss til mennesker?
Men språkteknologi i seg selv er ikke nødvendigvis et onde. For drøye 5000 år siden fant mennesket opp en vidunderlig avansert teknologi – skriftspråket. Skriftspråket er en utrolig mulighet for oss til å gjengi tankene våre, ikke bare i sanntid, men skrevet slik at vi kan lagre dem og dele dem og bygge på tidligere generasjoners tanker og kunnskap når vi skal bygge vår egen kunnskapsbase.
Og selv om skriftspråket aldri kan bli så nyansert som talespråket, er det i alle fall fremdeles menneskespråk. Jeg kan ikke fri meg fra å tenke at vi som samfunn ville kommet mye lenger om vi fortsatte å satse på denne teknologien – som ikke har språkmodellenes voldsomme etiske skyggeside: koblinger til økonomiske interesser, tyveri av andre menneskers åndsverk og en enorm ressurssløsing.
Vår egen språkevne er enormt mye mer sofistikert enn en språkmodell – og skriftspråket vårt er fremdeles den beste språkteknologien på markedet.
Jeg mistenker at de som tror at språkmodeller kan bidra med noe i prosesser som dreier seg om kunnskapsutvikling, rett og slett ikke har nok innsikt menneskespråket til å forstå hva vi mister når vi setter bort arbeidet med utvikling av konseptene våre og skriftspråket vårt til en maskin.
Er vi i ferd med å delegere vekk til maskiner noe av det som gjør oss til mennesker?
Nylige artikler
– Det er en borgerplikt å dele kunnskapen
Universitetene skal ikke bli beredskapsmotorer — men de må heller ikke stå på sidelinjen
På tide å lette på trykket, mener UiS-ansatte
Federica Mogherini sier opp som rektor etter korrupsjonsanklagene
Hva venter vi på?
Mest leste artikler
Direktør med uheldig «klaps» på direktesendt TV
På pulten til historieprofessoren låg ein lapp med beskjed om å rydda
Føler seg avskiltet etter søknad om merittering
Slutt på at ansatte kan bruke Airbnb og Booking.com på jobbreiser
Rektor Mogherini arrestert etter korrupsjonsanklager