Debatt ● Marija Slavkovik og Maria-Carme Torras-Calvo
Ingen sannhet uten kritisk tenkende
Vi tar alle fram telefonen, når vi skal sjekke fakta. Men er det vi finner ut der sant?

Denne teksten er et debattinnlegg. Innholdet i teksten uttrykker forfatterens egen mening.
Informasjonen på nettet er ikke pålitelig og, kanskje mer overraskende, ikke varig heller. Kunstig intelligens (KI) bare gjør det verre. Vi som skriver dette, jobber med informasjonssystemer på forskjellige måter, og er bekymret for hvor sannheten blir av i denne teknologiens alder. Den ene av oss jobber med bibliotek og den andre med kunstig intelligens.
For å vite om noe er sant, er vi avhengige av pålitelige informasjonskilder. Fordi vi har internett, tar vi for gitt at informasjon er lett tilgjengelig og permanent. Men begge disse forestillingene er illusjoner. Sannhetssøken på nett forutsetter pålitelig informasjonslagring og gjenfinning. Informasjon må lagres trygt, slik at den ikke endres ved uhell eller forsettlig, og den må lagres slik at den kan hentes ut effektivt. Informasjonen som hentes ut, må i tillegg være sannferdig eller korrekt.
Hvordan klarte vi oss før internett, søkemotorer og KI? Data, det vil si informasjon som kan bli prosessert, begynner med et behov for å lagre dokumenter på en sikker og lett prosesserbar måte. Bibliotekarer og arkivarer har perfeksjonert disse informasjonsorganiseringsssystemene siden den gang. Så sent som på 1970-tallet, ville man konsultert et bibliotek for å kunne finne og vurdere om informasjon er korrekt.
Nå har vi KI, som tilsynelatende kan gå fra informasjon til sannhet på noen sekunder. Problemet er bare at det fortsatt ikke finnes noen sannhet uten kritisk tenkende mennesker.
Data er samlingen av de minste informasjonsenhetene som kan behandles av en datamaskin. Forholdet mellom informasjon og kunnskap er den magien som skjer, studert i filosofien av en underdisiplin kalt epistemologi. Skal man prøve å lete etter sannheten, er det mye som må skje - man må vurdere dataene foran seg, konseptualisere, identifisere, måle, og evaluere dem. Å gå fra data til informasjon er det datamaskiner og KI hjelper med. Bare kritisk tenkende mennesker kan gå fra informasjon til sannhet.
For å forstå hvorfor internett er en så dårlig datalager og KI er så dårlig til å hente ut sannheten, må vi gå inn i mer tekniske og historiske detaljer. Da verden produserte mer data enn den kunne behandle, ble forskjellige lagrings- og gjenfinningsmedier og -strategier tatt i bruk. Datateknologien lånte tungt fra erfaringene med bibliotekets informasjonshåndtering for å utvikle filsystemorganiseringen som du ser i dag på maskinene dine.
Først kom databasene. Databaser er datalagringsenheter bygget etter en formell konstruksjon (les matematikk) for permanent datalagring og effektiv datagjenfinning. For databaser finnes det matematisk bevis for at det du henter ut ved hjelp av søkestrengen, er sannheten, hele sannheten og ingenting annet enn sannheten. Det er akkurat dette du ønsker, når du håndterer bankkontoer og eiendomsregistre.
Databaser er dyre å vedlikeholde og opplæring er nødvendig for å kunne bruke dem. Videre er de bygget for lagring og gjenfinning av informasjon, ikke for deling av denne.
Rundt slutten av 90-tallet ble internett en vare. Alle kunne bare bruke det. Internett er altså bygget for informasjonsdeling. Men det krever fortsatt datalagring og kjapp gjenfinning. Og det krever fortsatt menneskelig datakuratering.
Digitale ressurser, akkurat som alle materielle ressurser, har en tidsbegrenset levetid. Vi har en illusjon om at data er noe permanent på internett, men digitale ressurser kan likeledes forvitre veldig raskt uten at noen tar vare på dem.
Data har blitt manipulert og tuklet med gjennom århundrene for å passe den ønskede virkeligheten til de som styrer verden.
Når den videoen av ditt berusede ansikt på Ibiza blir lastet opp, er egentlig ikke der for alle å finne for alltid. Vi forveksler faktisk datapermanens med mangel på kuratering. Dataene på internett er distribuert uten oversikt over hvor mange kopier som finnes og hvor de er. Data blir dumpet overalt, så vi kan aldri være sikre på om alt er slettet. Men vi kan heller ikke være sikre på at noe av det blir beholdt.
Datamediets natur har én til mer interessant trekk: det tar ned kraftig datamanipulasjonens kostnader i penger og innsats. Data har blitt manipulert og tuklet med gjennom århundrene for å passe den ønskede virkeligheten til de som styrer verden. Et bilde fra 1897 av et møte i St. Petersburg-avdelingen av Kampforbundet for frigjøring av arbeiderklassen ble endret i 1930 for å fjerne Lenins tidligere kamerat Mikhail Kalinin etter at han ble henrettet for å være en «sabotør».
Fram til den digitale tidsalderen, har kostnaden for datakuratering, sammenlignet med datamanipulasjon, vært den samme. Det var hardt arbeid å redigere fotografier og dra til alle bibliotek for å brenne de svartelistede bøkene. Kostnaden for datakuratering er fortsatt høy, men nå har kostnaden for datamanipulasjon stupt, spesielt når den drives av KI. Det er nå enda lettere å redigere sannheten, hvis vi lar den være prisgitt algoritmer.
Liker du sannheten? Bibliotekene er samfunnets hukommelse. Datateknologiselskaper er privateid av et mangfold av aktører som har et mangfold av ideologiske og kommersielle interesser. Til tross for at de har vært usynlige i den offentlige debatten om sannhet, «fake news» og KI, er bibliotekarer og de institusjonene de forvalter unnværlige. Om kildene forsvinner, forsvinner sannheten med dem.
Nylige artikler
– Det er en borgerplikt å dele kunnskapen
Universitetene skal ikke bli beredskapsmotorer — men de må heller ikke stå på sidelinjen
På tide å lette på trykket, mener UiS-ansatte
Federica Mogherini sier opp som rektor etter korrupsjonsanklagene
Hva venter vi på?
Mest leste artikler
Direktør med uheldig «klaps» på direktesendt TV
På pulten til historieprofessoren låg ein lapp med beskjed om å rydda
Føler seg avskiltet etter søknad om merittering
Slutt på at ansatte kan bruke Airbnb og Booking.com på jobbreiser
Rektor Mogherini arrestert etter korrupsjonsanklager