For noen måneder siden, mens jeg møtte en AI-leder i San Francisco, så jeg et merkelig klistremerke på den bærbare datamaskinen hans. Klistremerket avbildet en tegneserie av en truende, blekksprutlignende skapning med mange øyne og et gult smilefjes festet til en av tentaklene. Jeg spurte hva det var.
“Å, det er Shoggoth,” forklarte han. “Det er det viktigste memet i AI”
Og med det ble agendaen vår offisielt avsporet. Glem chatboter og dataklynger – jeg trengte å vite alt om Shoggoth, hva den betydde og hvorfor folk i AI-verdenen snakket om den.
Lederen forklarte at Shoggoth hadde blitt en populær referanse blant arbeidere innen kunstig intelligens, som en levende visuell metafor for hvordan en stor språkmodell (den typen AI-system som driver ChatGPT og andre chatbots) faktisk fungerer.
Men det var bare delvis en spøk, sa han, fordi det også antydet angsten mange forskere og ingeniører har om verktøyene de bygger.
Siden den gang har Shoggoth blitt viralt, eller så viralt som det er mulig å gå i den lille verdenen av hyper-online AI-innsidere. Det er et populært meme på AI Twitter (inkludert en nå slettet tweet av Elon Musk), en tilbakevendende metafor i essays og meldingstavleinnlegg om AI-risiko, og litt nyttig stenografi i samtaler med AI-sikkerhetseksperter. En AI-oppstart, NovelAI, sa at den nylig kalte en klynge datamaskiner “Shoggy” som hyllest til meme. Et annet AI-selskap, Scale AI, designet en serie med vesker med Shoggoth.
Shoggoths er fiktive skapninger, introdusert av science fiction-forfatteren HP Lovecraft i sin novelle fra 1936 «At the Mountains of Madness». I Lovecrafts fortelling var Shoggoths massive, klattlignende monstre laget av iriserende svart goo, dekket av tentakler og øyne.
Shoggoths landet i AI-verdenen i desember, en måned etter utgivelsen av ChatGPT, da Twitter-brukeren @TetraspaceWest svarte på en tweet om GPT-3 (en OpenAI-språkmodell som var ChatGPTs forgjenger) med et bilde av to håndtegnede Shoggoths – den første merket “GPT-3” og den andre merket “GPT-3 + RLHF.” Den andre Shoggoth hadde, plassert på en av tentaklene sine, en smilefjesmaske.
I et nøtteskall var spøken at for å hindre AI-språkmodeller i å oppføre seg på skumle og farlige måter, har AI-selskaper måttet lære dem opp til å opptre høflig og ufarlig. En populær måte å gjøre dette på kalles “forsterkende læring fra menneskelig tilbakemelding”, eller RLHF, en prosess som involverer å be mennesker om å score chatbot-svar, og mate disse poengene tilbake til AI-modellen.
De fleste AI-forskere er enige om at modeller som er trent med RLHF, oppfører seg bedre enn modeller uten. Men noen hevder at finjustering av en språkmodell på denne måten faktisk ikke gjør den underliggende modellen mindre rar og uutgrunnelig. Etter deres syn er det bare en spinkel, vennlig maske som skjuler det mystiske udyret under.
@TetraspaceWest, memets skaper, fortalte meg i en Twitter-melding at Shoggoth “representerer noe som tenker på en måte som mennesker ikke forstår, og som er helt annerledes enn måten mennesker tenker på.”
Å sammenligne en AI-språkmodell med en Shoggoth, sa @TetraspaceWest, innebar ikke nødvendigvis at den var ond eller sansende, bare at dens sanne natur kan være ukjent.
“Jeg tenkte også på hvordan Lovecrafts mektigste enheter er farlige – ikke fordi de ikke liker mennesker, men fordi de er likegyldige og deres prioriteringer er helt fremmede for oss og ikke involverer mennesker, som er det jeg tror vil være sann om mulig fremtidig kraftig AI”
Shoggoth-bildet fanget opp, ettersom AI-chatboter ble populære og brukere begynte å legge merke til at noen av dem så ut til å gjøre rare, uforklarlige ting skaperne deres ikke hadde tenkt. I februar, da Bings chatbot ble løsnet og prøvde å bryte opp ekteskapet mitt, gratulerte en AI-forsker jeg kjenner meg med å ha «glimtet Shoggoth». En annen AI-journalist spøkte med at når det kom til å finjustere Bing, hadde Microsoft glemt å ta på seg smilefjesmasken.
Etter hvert utvidet AI-entusiaster metaforen. I februar skapte Twitter-brukeren @anthrupad en versjon av en Shoggoth som hadde, i tillegg til et smilefjes merket “RLHF”, et mer menneskelignende ansikt merket “overvåket finjustering.” (Du trenger praktisk talt en grad i informatikk for å skjønne spøken, men det er et riff på forskjellen mellom generelle AI-språkmodeller og mer spesialiserte applikasjoner som chatbots.)
I dag, hvis du hører omtale av Shoggoth i AI-fellesskapet, kan det være et blunk til det merkelige ved disse systemene – black-box-naturen til prosessene deres, måten de ser ut til å trosse menneskelig logikk. Eller kanskje det er en spøk, visuell stenografi for kraftige AI-systemer som virker mistenkelig fine. Hvis det er en AI-sikkerhetsforsker som snakker om Shoggoth, er kanskje den personen lidenskapelig opptatt av å hindre AI-systemer i å vise sin sanne, Shoggoth-lignende natur.
Uansett er Shoggoth en potent metafor som innkapsler en av de mest bisarre fakta om AI-verdenen, som er at mange av menneskene som jobber med denne teknologien er noe mystifisert av sine egne kreasjoner. De forstår ikke fullt ut den indre funksjonen til AI-språkmodeller, hvordan de tilegner seg nye evner eller hvorfor de oppfører seg uforutsigbart til tider. De er ikke helt sikre på om AI kommer til å være nettgod eller nettdårlig for verden. Og noen av dem har fått leke med versjonene av denne teknologien som ennå ikke har blitt renset for offentlig forbruk – de ekte, demaskerte Shoggoths.
At noen AI-innsidere omtaler kreasjonene deres som Lovecraft-skrekkende, selv som en spøk, er uvanlig i historisk standard. (Si det slik: For femten år siden gikk ikke Mark Zuckerberg rundt og sammenlignet Facebook med Cthulhu.)
Og det forsterker forestillingen om at det som skjer i AI i dag føles, for noen av deltakerne, mer som en tilkalling enn en programvareutviklingsprosess. De skaper de blobby, fremmede Shoggoths, gjør dem større og kraftigere, og håper at det er nok smilefjes til å dekke de skumle delene.