De hand van God – A woven web of guesses

Het hoofdstuk met deze titel in De MANIAC van Benjamín Labatut gaat over de vierde partij die AlphaGo en Lee Sedol spelen in hun legendarische Go tweekamp in 2016. Labatut introduceert Sedol als “… de enige mens die ooit in toernooiverband een geavanceerd kunstmatige intelligentiesysteem heeft verslagen.”

Beeld uit de documentaire AlphaGo

Ik schreef in Move 37 over de iconische zet van de computer in de tweede partij, die een kantelpunt zou markeren in de ontwikkeling van AI. Een zet van de computer die op het moment zelf door alle experts werd afgedaan als onzinnig, een fout, maar feitelijk de winnende zet is. De kans dat een mens die zet zou doen werd ingeschat op minder dan 1:10.000. De zet zelf werd daardoor beoordeeld als in hoge mate creatief en intuïtief.

De tweekamp eindigt met de stand van 4-1 in het voordeel van de computer. Gegeven de aard van het Go spel als ultieme uitdaging voor de menselijke intelligentie en creativiteit werd de prestatie van het AI systeem gezien als een belangrijke stap naar het niveau van menselijke intelligentie.

Maar Sedol wint één partij, de vierde, Labatut doelt daarop in zijn introductie. Ook die partij kent een kantelpunt zoals in de tweede partij. Nu is het de 78e zet, een zet van de menselijke speler Lee Sedol.

Na het lezen van De MANIAC, een fascinerend boek, heb ik de gehele documentaire AlphaGo bekeken. Daar komt ook de kant van de ontwikkelaars van DeepMind uitgebreid aan bod. AlphaGo verliest de vierde partij omdat het na die 78e set volledig de draad kwijt raakt.

Het systeem verliest zich in het nazoeken van mogelijke winnende voortzettingen, tot aan wel 95 zetten diep (terwijl 50-60 normaal was). Tevergeefs want zulke zetten waren niet aanwezig in de kennisbasis van AlphaGo en ook niet in bereik van zijn zoekmethode MCTS, Monte Carlo Tree Search, een op kansrekening gebaseerde simulatie.

De ontwikkelaars hebben de hele partij nog een keer met het systeem nagespeeld, met verwisseling van de spelers. De inschatting van de 78e zet van Sedol was: een verwaarloosbare kans van minder dan 1:10.000 dat een mens die zet zou doen. Het spiegelbeeld van Move 37.

De zet wordt in Korea de hand van God genoemd. Bij DeepMind waren ze wat pragmatischer, ze concludeerden dat de zwakte van AlphaGo is dat het getraind is op honderdduizenden partijen die door mensen gespeeld zijn – goede spelers, maar goddelijke zetten zaten er niet bij.

Ze hebben daarna het roer helemaal omgegooid. Het systeem werd volledig gestript van alle menselijke labeling. De training van het nu weer lege systeem bestond volledig uit partijen die het tegen zichzelf speelde. Zo maakten ze een nieuw AI systeem, AlphaZero. Het is niet alleen een betere variant van AlphaGo, maar ook in staat om op dezelfde manier andere spellen, zoals bijv. schaken, te leren (en te winnen) én om andere cognitieve taken uit te voeren. Zo is er inmiddels een variant, AlphaFold, die voorspellingen doet over nieuwe complexe eiwitstructuren met een nauwkeurigheid die vergelijkbaar is met experimentele methoden.

Move 37 is een mijlpaal in de ontwikkeling van AI, maar als je een kantelpunt zou willen aanwijzen dan is dat, achteraf gezien, zet 78 in de vierde partij. De zet was niet winnend voor AI, maar wijst de weg naar werkelijk zelf lerende systemen die alle cognitieve taken aan kunnen. In het huidige discours wordt het AGI genoemd, Artificial General Intelligence. Het is de heilige graal in AI research.

Bij DeepMind willen ze die graal graag vinden. In samenwerking met Google Brain (een onderzoeksgroep binnen Google) wordt al jaren gewerkt aan een AI systeem dat de capaciteiten combineert van AlphaZero en een eigen LLM, vergelijkbaar met GPT4.
De werktitel is Gemini, naar verwachting wordt in oktober 2023 een eerste openbare versie gepresenteerd.

NB DeepMind en Google Brain horen beide tot Alphabet en zullen volgens een aankondiging van april 2023 samengaan in één organisatie, onder de naam Google DeepMind.

Gemini zal een serieuze stap zijn op weg naar AGI. Verontrustend? Mogelijk wel want de ‘intelligentie’ van AGI overstijgt wellicht de menselijke intelligentie – en brengt ‘de hand van God’ dichterbij. Het zou kunnen dat Gemini als open source wordt neergezet, maar dat het allemaal bij Google zit is niet per se geruststellend. Waar zit de schakelaar?

Geef een reactieReactie annuleren