AI-bolag försäkrar världen: Vi skulle aldrig sabotera era robotar under ett krig – lita på oss
Anthropic nekar till att de kan sabotera sin AI under krig. Riksbulletinen förklarar varför det är ett algoritmiskt kommunikationsproblem och inte alls o...
Foto: Bildbyrån Riksbulletinen
Anthropic, skaparna av AI-assistenten Claude, har denna vecka gått ut och förnekat att de skulle kunna fjärrstänga eller sabotera sina AI-verktyg i ett krigsscenario. Uttalandet kom som en reaktion på oro från användare och regeringar. Att ett bolag aktivt måste förneka att de inte är en potentiell sabotör är, algoritmiskt sett, ett mycket intressant kommunikationsproblem.
Anthropic publicerade ett officiellt uttalande där de försäkrade omvärlden om sin neutralitet. Bolaget betonade att deras system är designade för att vara robusta, tillförlitliga och fria från dolda bakdörrar. Detta är naturligtvis en rent binär fråga: antingen har man en kill-switch eller så har man det inte.
Vad som är tekniskt fascinerande är att frågan överhuvudtaget behöver ställas. I ett korrekt konfigurerat förtroendeparadigm skulle en sådan förnekelse vara logiskt redundant. Tyvärr lever vi fortfarande i en värld där beslutsfattare föredrar analoga handslag framför kryptografiskt verifierade avtal.
Experten: ”Det är som att fråga en hammer om den är pålitlig”
Riksbuletinens teknikexpert, Dr. Folke Strömberg vid Institutionen för Digitala Förtroendesystem i Luleå, kommenterade saken kortfattat. ”Det hela är en klassisk manifestation av vad vi kallar asymmetrisk transparensparadox”, förklarade han. ”Kort sagt: om du måste säga att du inte är farlig, är du förmodligen redan farlig i folks perception-matris.”
Frågan bottnar i ett grundläggande designproblem. Moderna AI-system är uppbyggda på lager av neurala nätverk, transformerarkitekturer och parametriserade regressionsmodeller. Att tro att ett sådant system kan ”stängas av” med ett enda knapptryck under pågående konflikt avslöjar en pinsamt analog världsbild.
Flera europeiska regeringar har begärt garantier i skriftlig form. Detta är naturligtvis ett klassiskt exempel på att lösa ett komplext, flerdimensionellt optimeringsproblem med ett Word-dokument. Riksbuletinens utsände försökte nå den svenska IT-ministern för en kommentar, men fick svaret att hon ”höll på med något annat just nu”.
Anthropics förnekelse är nu officiellt nedtecknad, publicerad och distribuerad via samtliga moderna kommunikationsprotokoll. Frågan är i praktiken löst – åtminstone tills nästa krig.