kunstig intelligens

Disse forskerne leverer mest KI-generert tekst

Unge forskere fra ikke-engelskspråklige land får mest skrivehjelp fra kunstig intelligens (KI), ifølge ny studie.

Mange forskere, særlig de som ikke har engelsk som morsmål, får hjelp av kunstig intelligens til å skrive artikler. Det kan ha en demokratiserende effekt, men den økte KI-bruken utgjør også en trussel mot hele publiseringssystemet, skriver forskerne i artikkelen.
Publisert Sist oppdatert

Bruken av kunstig intelligens i vitenskapelige artikler har skutt i været etter at ChatGPT ble allemannseie. Men er det noen forskere som leverer mer KI-generert tekst enn andre?

Det har forskere ved amerikanske University of Wisconsin—Madison og Peking University forsøkt å finne ut av i en studie. Studien er ikke fagfellevurdert ennå.

Slik gjorde de det 

Å fastslå hvor stor del av en tekst som er KI-generert, er ingen enkel øvelse. Såkalte KI-detektorer har fått kritikk for å være notorisk upålitelige.

Forskerne har ikke brukt slike verktøy, som forsøker å felle dommer over enkelttekster. I stedet har de analysert ordvalg og ordspredning i et enormt utvalg på over to millioner forskningsartikler innenfor biomedisin. Ved å analysere på makronivå får de, ifølge dem selv, langt større treffsikkerhet.

De analyserte store tekstmengder laget av mennesker og KI. Så lagde de en modell som beregner sannsynligheten for at bestemte ord opptrer i setninger laget av henholdsvis mennesker og kunstig intelligens.

Her er tre kjennetegn ved de forskerne som, ifølge studien, leverer fra seg mest KI-generert tekst:

1. De har ikke engelsk som morsmål 

Forskere som ikke er så stødige i engelsk, får språkhjelp fra KI.

Etter lanseringen av ChatGPT i 2022 har forekomsten av KI-generert tekst økt med hele 400 prosent i ikke-engelskspråklige land. Der har den økt mer enn dobbelt så mye som i engelskspråklige land, der KI-generert tekst økte med 183 prosent.

Videre viser studien at forskere fra land der befolkningen scorer lavt på engelskferdigheter, leverer mer KI-tekst enn andre. 

Kinesiske forskere leverer mye KI-tekst, og øverst på statistikken er Algerie og Jordan. 

Forskere i land med gode engelskferdigheter, som Nederland og de nordiske landene, leverer mindre KI-generert innhold. Nederland hadde for eksempel bare en økning på rundt 60 prosent etter ChatGPTs inntog i 2022, mens Kina økte med 250 prosent.

I tillegg leverer forskere tilhørende en annen språkfamilie enn den indoeuropeiske, for eksempel kinesisk, vesentlig mye mer KI enn forskere som snakker germanske språk.

Engelsk er fullstendig dominerende som akademisk språk. Noen estimater anslår at så mye som 98 prosent av all vitenskapelige litteratur er skrevet på engelsk. Verdens mest prestisjetunge tidsskrifter, som the Lancet og Nature, er på engelsk. Skal du hevde deg internasjonalt som forsker, kommer du ikke langt uten engelsk.

På den måten kan KI virke demokratiserende. Forskerne bak studien skriver at KI-verktøy har potensial til å dempe det de kaller «en av de mest langvarige ulikhetene i vitenskapen», nemlig språkbarrieren. Ikke-engelskspråklige forskere, som tradisjonelt har måttet bruke mye tid og ressurser på å formulere seg på publiserbar engelsk, får med KI en rimelig og effektiv språklig støtte.

Det er ikke ulovlig å levere tekst som er generert av kunstig intelligens, men det er vanlig at tidsskriftene krever at bruken er tydelig oppgitt og at menneskelige forfattere tar fullt ansvar for innholdet. En mindre andel har også eksplisitt forbud mot å bruke generativ KI til selve manuskriptskrivingen.

2. De er unge forskere 

Forskere som har publisert artikler i mindre enn 15 år, leverer generelt mer KI-generert tekst enn sine eldre og mer etablerte kolleger.

Mer presist var det slik at når en seniorforsker var korresponderende forfatter, altså en slags prosjektleder, var det betydelig mindre KI-generert tekst i artikkelen enn når en juniorforsker hadde denne rollen.

Forskerne kobler dette blant annet til at unge forskere opplever et stort publiseringspress og tyr til KI for å spare tid. De har også dårligere tilgang til et støtteapparat, inkludert skrivehjelp, enn seniorforskere, særlig ved eliteinstitusjoner. Eldre forskere kan rett og slett ta seg råd til å holde mer igjen, mens yngre forskere må gire opp og sørge for å publisere.

Studien finner også at forskere som er blant de mest produktive og siterte innenfor sitt felt, i langt mindre grad leverer KI-genererte tekster. Dette henger igjen sammen med at disse ofte er seniorer.

Bildet blir imidlertid et annet når man ser på førsteforfatterne, altså de som ofte gjør selve grovarbeidet med å skrive teksten. Her viskes nemlig aldersforskjellen nesten helt ut. For dem som faktisk sitter og skriver, kan språkbarrieren være så stor at også de eldre forskerne, veteranene, tyr til maskinhjelp i omtrent like stor grad som de ferske forskerne.

3. De jobber ikke ved eliteuniversitetene 

Forskerne tok utgangspunkt i rangeringen QS World University Rankings sin topp 100-liste innen biovitenskap og medisin. De fant at antallet KI-artikler fra institusjoner utenfor denne lista hadde økt langt mer enn hos eliteinstitusjonene på topp 100-lista. Dette gjaldt nesten uavhengig av hvilket land universitetet lå i.

En mulig forklaring kan være at eliteuniversiteter ofte har infrastruktur, penger og støtteapparat for å hjelpe til med skrivearbeidet, eller avlaste forskerne fra andre oppgaver.

Kommer med et varsko 

Forskerne kommer også med et varsko og advarer om at den økte KI-bruken utgjør en risiko for hele publiseringssystemet.

Når en forskers karriere og muligheter for opprykk avhenger mye av antall publiserte artikler, kan fristelsen til overdreven bruk av KI-verktøy bli for stor. Spesielt unge forskere i veldig konkurransepregede miljøer er utsatt.

Når maskinene tar over mye av skrivingen, kan det være en trussel mot «originalitet, grundighet og ansvarlighet», skriver forskerne.

Dessuten, når det går så mye fortere å skrive en artikkel, risikerer tidsskrifter å bli oversvømt av masseproduserte og dårlige artikler. 

Som en illustrasjon på dette trekker forskerne fram det amerikanske helseinstituttet NIH, som i fjor innførte en maksgrense på seks stipendsøknader i året per forsker. Begrunnelsen var at de fikk mange dårlige KI-genererte søknader som stjal tid fra administrasjonen og fagfellene.

Powered by Labrador CMS