Google DeepMind heeft SIMA 2 gelanceerd, een nieuwe generatie AI-agent die zich profileert als een “companion” binnen virtuele werelden. Dit markeert een belangrijke verschuiving van de eenvoudige, reactieve acties naar een meer complexe interactie waar AI kan plannen, zichzelf uitleggen en leren uit ervaring. Dit komt met de ambitie om een stap dichter bij Artificial General Intelligence (AGI) te komen, een doel dat belangrijke implicaties heeft voor zowel de robotica als bredere AI-toepassingen.
De eerste SIMA (Scalable Instructable Multiworld Agent) werd in maart 2024 gelanceerd en leerde honderden basale vaardigheden door simpelweg de interactie met het scherm te observeren. In deze nieuwe versie kan de AI zelfstandig redeneren. Volgens Google is SIMA 2 hun meest geavanceerde AI-agent voor virtuele 3D-werelden, uitgerust met het Gemini-model, dat deze agent in staat stelt om niet alleen basale instructies op te volgen, maar ook om na te denken, te begrijpen en betekenisvolle acties te ondernemen in interactieve omgevingen. Dit betekent dat men niet alleen met het systeem kan communiceren via tekst of spraak, maar zelfs door gebruik te maken van afbeeldingen.
Met behulp van het Gemini AI-model kan SIMA 2 nu hogere doelen interpreteren en de stappen toelichten die het van plan is te nemen. De effectiviteit van deze aanpak blijkt uit de sterke generalisatie door verschillende virtuele omgevingen. SIMA 2 is in staat langere en complexere taken te voltooien, zoals logische puzzels en het gebruiken van visuele cues, en heeft een verbazingwekkende 65% taakvoltooiingspercentage bereikt, tegenover 31% bij zijn voorganger. Dit biedt een cruciale inkijk in de vooruitgang die de AI heeft gemaakt en wat dit betekent voor de toekomst van gebruikersinteractie en game-ervaring.
Een opmerkelijke ontwikkeling is dat SIMA 2 zich kan aanpassen aan nieuwe 3D-werelden die door een ander project van DeepMind, Genie 3, zijn gecreëerd. Dit systeem genereert interactieve omgevingen op basis van een enkele afbeelding of tekstprompt. Tijdens tests kon SIMA 2 zich snel oriënteren, zijn doelen begrijpen en effectief handelen in deze onbekende werelden. Het systeem demonstreert een capaciteitsverbetering die verder gaat dan eenvoudige reacties; het kan concepten zoals ‘mining’ in één spel overdragen naar ‘harvesting’ in een ander, wat de waarde aantoont van transfer learning—de mogelijkheid om kennis van de ene context naar de andere te verplaatsen.
Desondanks blijft er ruimte voor verbetering; het onderzoek identificeerde tekortkomingen zoals het omgaan met zeer lange en complexe taken, beperkte geheugenstructuren en visuele interpretatieproblemen. Ondanks deze uitdagingen beschouwt DeepMind SIMA 2 als een waardevol testplatform voor toekomstige toepassingen in zowel robotica als navigatie. De ontwikkeling van SIMA 2 biedt dus niet alleen nieuwe mogelijkheden binnen de digitale domeinen, maar legt ook een solide basis voor de toekomst van intelligentie in de echte wereld.
Wat maakt SIMA 2 anders dan zijn voorganger?
SIMA 2 kan nu zelfstandig redeneren en weegt zijn acties beter af, waardoor het effectiever lange en complexe taken kan uitvoeren.
Hoe draagt SIMA 2 bij aan de ontwikkeling van AGI?
Door de autonomie en adaptieve leerprocessen van SIMA 2 komen we dichter bij een AI die menselijke niveaus van begrip en redenering kan nabootsen.
Welke uitdagingen blijven er voor de toekomst van SIMA 2?
Zowel de verwerking van complexe multi-stap taken als visuele interpretatieproblemen in nieuwe omgevingen blijven uitdagingen die opgelost moeten worden om volledige effectiviteit te bereiken.
