Extrakapitel: Koden på gravstenen
Extra bonuskapitel till Den femte accelerationen. Av och med Mathias Sundin.
Dela artikeln
Här är ett extrakapitel till Den femte accelerationen av och med författaren Mathias Sundin.
För några år sedan efter en konferens i Boston begav jag mig ut till Mount Auburns begravningsplats. Inte på grund av någon morbid passion, utan för att jag letade efter en särskild gravsten. På baksidan av den skulle ett hemligt meddelande finnas dolt.
Gravarna reste sig i ett böljande landskap, med dammar och stora lummiga träd där ekorrar skuttade mellan grenarna. Här vilade många kända personer: Abraham Maslow, han med behovstrappan; Edwin Land, uppfinnaren av Polaroidkameran; och de duellerande filosoferna Robert Nozick och John Rawls.
Över 90 000 personer är begravda där, så det tog en stund att hitta rätt. Plötsligt såg jag den, en enkel granitgrå gravsten. På framsidan stod namnet på personen, men det var baksidan jag var allra mest spänd på. Budskapet som påstods finnas där skulle förklara hur mänskligheten kunde ta steget från en tidsålder in i en annan. Från industrisamhället till informationssamhället.
Jag gick fram till gravstenen och slängde en blick över axeln för att se om någon iakttog mig. Kanske hade jag läst för många av Dan Browns böcker, men jag kände mig som Robert Langdon som böjde sig fram för att studera ett dolt budskap i en religiös symbol. Därför blev jag lättad över att ingen ondskefull albino tycktes övervaka mig.
Jag klev runt gravstenen – och där stod det. En formel så kraftfull att den förändrat hela världen, skapat enorma företag, påverkat politik, underhållning, nyheter, media och kommunikation och lett till stora forskningsgenombrott. Utan denna formel hade inget av det varit möjligt. Inte heller artificiell intelligens.
Egentligen borde jag väl ha tagit in några av Bostons sevärdheter eller fikat med en levande person, nu när jag ändå åkt hundratals mil dit. Men gravstenen, formeln och dess skapare fascinerade mig mer än något annat. Kanske skulle jag, genom att se det med egna ögon, förstå mer om den digitala värld vi levde i och framför allt om framtiden.
När jag stod där tänkte jag på formelns skapare. Ett geni i sin renaste form, men också en udda, konstig och rolig människa. I hans huvud satt en hjärna som klarade att se saker ingen annan människa sett. Som så många andra personer som förändrat vår värld passade han inte in i en mall.
Men han var inte ett ensamt geni. Hans genombrott byggde på att koppla ihop kunskap andra skapat, något som möjliggjordes av den miljö han verkade i. En miljö där tankar och idéer var fria, inte bara i samhället utan även på hans arbetsplats, Bell Labs. Där tolererades personer som på andra ställen sågs som konstiga, och de fick utrymme att blomstra. Det var därför han kunde plocka upp till synes orelaterade intellektuella trådar och knyta ihop dem. Till något som kunde sammanfattas i en formel på baksidan av en gravsten.
Men det räckte inte för att skapa den nya världen. Andra var tvungna att ta vid. Omsätta formeln i praktiken och skapa allt det som den möjliggjorde. De som gjorde det var också ofta udda typer, otroligt envisa, med drömmar och idéer som ingen tidigare tänkt och framför allt inte lyckats göra något av.
En ekorre stannade till, reste sig på bakbenen och granskade mig. Kanske undrade den varför jag stod och stirrade på baksidan av en gravsten. Eller kanske funderade den på var den gömt sina nötter. Någonstans hade jag hört att ekorrar ofta glömde bort var de gömt sina byten.
Jag fortsatte att stirra på gravstenen, som förhäxad av koden:
H = – Σ p log p
H är lika med minus summan av p gånger logaritmen av p.
H står för entropi, och det är i praktiken en osäkerhetsmätare. Den svarar på frågan: Hur svårt är det att gissa vad som ska hända härnäst? Om det är lätt att gissa är entropin låg. Om det är svårt att gissa är entropin hög.
Inte osäkerhet som känsla, utan som egenskap hos ett system. Hur förutsägbart är det som händer härnäst? Hur mycket information finns egentligen i ett meddelande?
Det avgörande låg inte i de matematiska detaljerna, utan i perspektivskiftet. Om något är helt förutsägbart tillför det nästan ingen ny information. Ett meddelande som alltid ser likadant ut säger oss i praktiken ingenting. Men när flera olika saker rimligen kan hända, och inget alternativ dominerar helt, då blir varje nytt utfall informativt. Entropin fångade just detta: hur mycket osäkerhet som fanns inför nästa steg.
Det här låter abstrakt, men det har en mängd praktiska användningsområden. Datakomprimering, kryptering, telekommunikation och maskininlärning bygger i stor utsträckning på samma idé: information kan mätas, osäkerhet kan mätas, och när man kan mäta något kan man också optimera det. Utan den hade det inte gått att bygga världens digitala infrastruktur.
För att visa detta hade mannen i graven i ett paper skapat en mycket enkel språkgenerator. Den hade inga regler för grammatik, ingen förståelse för mening och ingen kunskap om världen. Den gjorde bara en sak: den valde nästa bokstav eller nästa ord baserat på sannolikheter, beräknade från tidigare text.
När generatorn bara valde bokstäver helt slumpmässigt blev texten oläsligt brus. När den tog hänsyn till sannolikheten för att vissa bokstäver följde på andra började mönster uppstå. Med ännu mer sammanhang – längre sekvenser – började texten plötsligt likna engelska. Inte korrekt, inte begriplig i egentlig mening, men tydligt språklik. Något hade uppstått ur ren sannolikhet.
Detta var ingen leksak vid sidan av teorin. Det var ett konkret bevis på vad entropibegreppet betydde i praktiken. Språk kunde beskrivas statistiskt. Struktur kunde växa fram utan förståelse. Och graden av osäkerhet avgjorde om resultatet blev kaos, mekanisk upprepning eller något som faktiskt liknade mänsklig kommunikation.
Decennier senare dök samma princip upp igen, i mycket större skala. De moderna språkmodeller som ligger till grund för generativ AI bygger inte på förståelse i mänsklig mening, utan på samma grundidé: att nästa ord kan väljas genom sannolikheter, och att balansen mellan förutsägbarhet och osäkerhet är avgörande.
Skillnaden nu och då är inte tänkesättet, utan omfattningen. Från en enkel språkgenerator på papper till modeller tränade på stora delar av mänsklighetens samlade texter. Men kärnan är densamma som på baksidan av gravstenen: att mäta osäkerhet – och använda den för att skapa struktur.
Allt började där. Med en formel. Och med en märklig insikt: att man kunde generera språk utan att förstå det, bara genom att räkna på hur överraskande nästa steg borde vara.
När jag stod där och tittade på den anspråkslösa gravstenen med den magiska koden överväldigades jag av människans uppfinningsrikedom. Vilken dramatisk förändring som kunde komma ur något så till synes enkelt. Hela vår digitala värld. Internetrevolutionen. Generativ AI.
Jag klev runt till gravstenens framsida igen. Tittade på namnet som stod där och nickade kort mot det. Ett litet enkelt tack. Fånigt kanske, men jag ville visa min uppskattning.
Det fanns en vacker symmetri i det hela. Koden på baksidan hade bevisats med en mycket simpel språkmodellen, den första som användes för att generera text. Tack vare att formeln sedan dess digitaliserat hela vår värld och samlat all vår kunskap online, kunde datorerna nu göra det hans första modell aldrig förmådde: faktiskt läsa orden på framsidan av gravstenen. En av dessa språkmodeller fick namnet Claude, efter honom. Det är den språkmodellen jag skrivit denna bok tillsammans med.
Där stod det, i enkel, tidlös granit:
Claude Elwood Shannon
1916–2001