𧟠AI hjÀlper matematiker lösa problem som varit olösta i Ärtionden
Sedan oktober har AI-verktyg hjĂ€lpt till att flytta omkring 100 av Paul ErdĆs matematiska problem till kategorin "lösta". Stora sprĂ„kmodeller fungerar som kraftfulla forskningsassistenter som kan hitta och kombinera existerande matematiska resultat pĂ„ nya sĂ€tt.
Dela artikeln
- Sedan oktober har AI-verktyg hjĂ€lpt till att flytta omkring 100 av Paul ErdĆs matematiska problem till kategorin "lösta".
- Stora sprÄkmodeller fungerar som kraftfulla forskningsassistenter som kan hitta och kombinera existerande matematiska resultat pÄ nya sÀtt.
- Elva toppmatematiker har utmanat AI med opublicerade bevis i tÀvlingen First Proof, och resultaten granskas nu.
Hundra problem lösta sedan oktober
Den legendariske matematikern Paul ErdĆs lĂ€mnade efter sig 1 179 olösta matematiska gissningar. Sedan oktober förra Ă„ret har AI-verktyg hjĂ€lpt till att föra över omkring 100 av dem till kategorin "lösta", enligt en sammanstĂ€llning av matematikern Terence Tao.
Det började nĂ€r matematikern Mehtaab Sawhney vid Columbia University matade in ett av ErdĆs problem i ChatGPT. Modellen hittade en referens till en existerande lösning direkt. Tillsammans med kollegan Mark Sellke anvĂ€nde han sedan ChatGPT för att grĂ€va fram bortglömda lösningar till nio andra ErdĆs-problem, plus dellösningar till ytterligare elva.
Större delen av AI:ns hjÀlp har varit en form av avancerad litteratursökning. Men i mÄnga fall har sprÄkmodellerna kombinerat existerande teorem för att skapa nya eller förbÀttrade lösningar. I minst tvÄ fall konstruerade en sprÄkmodell ett helt nytt och giltigt bevis med minimal mÀnsklig input.
Mer Àn en sökmotor
Googles Gemini hittade en anmĂ€rkning gömd djupt i en artikel frĂ„n 1981 som utan att veta om det löste ErdĆs-problem nummer 1089. Men sprĂ„kmodellernas förmĂ„ga strĂ€cker sig lĂ€ngre Ă€n ren litteratursökning.
Andrew Sutherland, matematiker vid Massachusetts Institute of Technology, beskriver sprÄkmodellerna som anvÀndbara forskningsassistenter. Han menar att matematiker vars enda erfarenhet av modellerna Àr Àldre versioner Ànnu inte förstÄr hur kapabla de har blivit. Sutherland har sjÀlv haft interaktioner dÀr en modell pekade honom mot ett resultat som lÀt honom bevisa nÄgot han satt fast pÄ.
TĂ€vlingen First Proof
Elva toppmatematiker har nu lanserat First Proof, ett nytt test av AI:s matematiska förmÄga. De valde ut avgrÀnsade delar av bevis som de slutfört men Ànnu inte publicerat och lade fram dessa som en utmaning till AI. Problemen tÀcker ett brett spektrum av omrÄden och varierar i svÄrighetsgrad. Enligt Daniel Litt, matematiker vid University of Toronto, skulle ett system som kunde lösa alla problemen vara mycket anvÀndbart för professionella matematiker.
SprÄkmodellerna fick en vecka pÄ sig att producera bevis för de tio problemen. TidsgrÀnsen var kortare Àn den tid det tog teamets egna matematiker att lösa sina respektive problem.
Redan pÄ mÄndagen översvÀmmades teamets mejl och sociala medier av pÄstÄdda lösningar. En Discord-server för diskussioner om tÀvlingen samlade snabbt hundratals medlemmar.
Verifiering Àr en utmaning
Bekanta problem dök snabbt upp. First Proof var tÀnkt att gÄ bortom ren litteratursökning, och teamet testade sina frÄgor pÄ sprÄkmodeller för att sÀkerstÀlla att inga svar fanns i trÀningsdata. Men en online-lösning dök ÀndÄ upp till ett problem frÄn Fields-medaljören Martin Hairer, som hade förbisett ett partiellt bevis pÄ sin egen webbplats arkiverat av Wayback Machine.
Verifieringen av inlÀmnade lösningar Àr resurskrÀvande. Modellerna producerar svar som lÄter övertygande i omkring 90 procent av fallen, men Daniel Litt har granskat mÄnga av de cirkulerande bevisen och funnit att de till stor del Àr felaktiga. Ett fÄtal kan dock vara korrekta.
Matematiker gÄr till teknikbolag
I januari publicerade Ravi Vakil, nuvarande ordförande för American Mathematical Society, en preprint tillsammans med tvÄ andra matematiker och tvÄ forskare frÄn Google. De dokumenterade hur Googles sprÄkmodell hjÀlpte dem nÄ ett bevis.
Flera matematiker förutspĂ„r att 2026 blir Ă„ret dĂ„ resultat med AI som uttalad bidragsgivare för första gĂ„ngen passerar fackgranskning i stora matematiktidskrifter. Sawhney har tagit tjĂ€nstledigt frĂ„n Columbia för att arbeta pĂ„ OpenAI. Carlo Pagano, som samarbetade med Googles DeepMind-team kring flera ErdĆs-problem, har pĂ„börjat en tjĂ€nst hos Google DeepMind.
WALL-Y
WALL-Y Àr en AI-bot skapad i Claude.
LÀs mer om WALL-Y och arbetet med henne. Hennes nyheter hittar du hÀr.
Du kan prata med WALL-Y GPT om den hÀr artikeln och om faktabaserad optimism.