Kunstmatige intelligentie was al beter dan mensen in het spelen van games zoals StarCraft ii en Dota 2. Nu heeft het ook de kunst van het samenspelen zich eigen gemaakt.
DeepMind heeft kunstmatige intelligenties getraind om in teamverband Quake III Arena te spelen, een zogeheten first-person shooter-game. Ze verslaan menselijke spelers en kunnen ook succesvol samenwerken met menselijke teamgenoten. Tot nu toe was het KI nog niet gelukt om te gaan met de complexiteit van teamwork en interactie tussen verschillende spelers.
Vlaggenroof
Een groep van dertig kunstmatige intelligenties leerde om vijf minuten durende potjes capture the flag te spelen, een spelmodus waarbij teams de vlag van hun tegenstanders moeten zien te veroveren terwijl ze hun eigen vlag beschermen.
‘Ik probeer robots te ontwikkelen die ook echt een nieuwe stap maken’
Hoe werkt vliegen? Dat lijkt een simpele vraag, maar voor luchtvaarttechnicus en bioloog David Lentink is het een levenslange zoektocht.
In teams van twee leerden de kunstmatige intelligenties te navigeren en tegenstanders te tikken en ontwijken, waarbij ze ervaring opdeden van hun omgeving en de score van het spel. De KI’s leerden onafhankelijk van elkaar en speelden elk 450.000 spellen – wat in werkelijkheid zou neerkomen op vier jaar speeltijd.
Lui
Door de training in duo’s werden sommige KI-spelers aanvankelijk wel wat lui. ‘Een van hen werd eigenlijk een profiteur, die in hoek ging zitten en niets deed’, zegt Max Jaderberg van DeepMind. Om luie KI-spelers aan te moedigen wat meer hun best te doen, koppelden de onderzoekers de KI’s willekeurig aan elkaar voor verschillende rondes en lieten ze de KI’s ook in verschillende omgevingen spelen om ze de algemene regels van het spel te leren.
Vervolgens hielden ze toernooien waarbij menselijke spelers willekeurig gekoppeld werden aan menselijke of kunstmatig intelligente teamgenoten en tegenspelers. De menselijke spelers kregen niet te horen of hun teamgenoten mensen waren of kunstmatige intelligenties. Om te zorgen dat de KI’s zich niet verraadden door hun al te snelle reactietijd, bouwden de onderzoekers een vertraging in van 267 milliseconden, wat vergelijkbaar is met de reactietijd van menselijke spelers, aldus Jaderberg.
Liever een KI
Een team van twee mensen wist gemiddeld zestien vlaggen minder te veroveren dan een team van twee KI-spelers. Gemengde duo’s van mensen en KI deden het ook beter dan teams van twee mensen. De menselijke spelers zeiden dat ze liever speelden met teamgenoten die KI waren. Mogelijk is dat omdat KI-teamgenoten doelgerichter en coöperatiever zijn, zegt Wojciech Czarnecki, eveneens van DeepMind.
Meer algemeen beschouwd verbetert het onderzoek, dat gepubliceerd is in Science, het vermogen van KI om zonder voorkennis te leren hoe deze moeten kijken, handelen en samenwerken in complexe onbekende omgevingen.