De huidige ontwikkelingen in kunstmatige intelligentie (AI) worden steeds meer beperkt door het onvermogen om fysieke ruimte te begrijpen. Fei-Fei Li, een vooraanstaande professor in de informatica aan Stanford, benoemt deze kloof als het grootste obstakel voor de technische vooruitgang. De dampkring van de AI-wereld is gevuld met mogelijkheden, maar de capaciteit van systemen om effectief om te gaan met de fysieke realiteit moet dringend worden verbeterd. Li pleit voor de ontwikkeling van systemen die zijn gebouwd rond ruimtelijk redeneren, in plaats van alleen technische taalverwerking.
De conceptuele basis van “wereldmodellen” gaat terug naar de vroege jaren veertig, toen de Schotse filosoof en psycholoog Kenneth Craik onderzoek deed naar cognitieve wetenschap. Dit idee kwam recentelijk opnieuw op de voorgrond dankzij een baanbrekend artikel van David Ha en Jürgen Schmidhuber in 2018. Hierin werd aangetoond dat een neuraal netwerk in staat is om een compacte interne representatie van een omgeving te leren en deze te gebruiken als simulator voor planning en controle. Dit is van cruciaal belang, omdat robotica en multimodale AI-systemen worstelen met ruimtelijke redenering, wat hen belemmert in het nauwkeurig inschatten van afstanden en het voorspellen van fysieke uitkomsten. Li benadrukt dat robots als menselijke samenwerkers enorme waarde kunnen toevoegen, bijvoorbeeld door wetenschappers in laboratoria te ondersteunen of ouderen bij te staan, en dat de huidige AI-technologieën hiertoe niet in staat zijn.
Om zijn punt te onderbouwen, wijst Li op de noodzaak voor systemen die in staat zijn gedurende verschillende dimensies te opereren. De fysische wetten van de natuur, zoals gravitatie en lichtinval, zijn cruciaal voor het modelleren van de werkelijkheid, en dit vereist systemen die ruimte kunnen onthouden en zich aanpassen aan veranderingen. Recentelijk heeft Li’s bedrijf World Labs de beta-versie van Marble geïntroduceerd, een vroeg prototype van een wereldmodel dat drie-dimensionale omgevingen genereert op basis van tekst- of afbeeldingsinvoer. Marble stelt gebruikers in staat om deze werelden te verkennen zonder tijdslimiet en zonder dat de integriteit van de omgeving afneemt. Dit is een bewuste poging om de basis te leggen voor een werkelijk ruimtelijk intelligente AI.
Volgens Li zou de opkomst van wereldmodellen de rol van AI in tal van toepassingen versterken – van het ondersteunen van real-time creatieprocessen tot het navigeren van robots en het verbeteren van wetenschappelijk onderzoek. Dit wijst niet alleen op een technologische verschuiving, maar op een paradigmawijziging waarbij AI in staat wordt gesteld om de wereld niet alleen te beschrijven, maar vooral te begrijpen. Dit leidt ons naar de volgende grens van AI: ruimtelijke intelligentie. Dit zou een transformatie met zich meebrengen waarbij waarneming kan overgaan in redenering, en creatie iets wordt dat niet alleen door mensen wordt gerealiseerd. De impact op de investeringswereld en technologieontwikkeling is onmiskenbaar, en biedt potentieel voor vernieuwende toepassingen en economische groei.
Wat zijn de belangrijkste obstakels voor de huidige AI-systemen?
De grootste obstakels zijn het gebrek aan begripsvermogen van fysieke ruimte en de onvrede met de huidige beperkingen van tekst-gebaseerde leerprocessen. AI moet verder ontwikkelen naar systemen die in staat zijn om ruimtelijk te redeneren.
Waarom zijn wereldmodellen cruciaal voor de toekomst van AI?
Wereldmodellen zijn essentieel omdat ze AI in staat stellen om een intern begrip van de wereld op te bouwen, wat de mogelijkheid biedt om omgevingen te simuleren en handelingen binnen die omgevingen te voorspellen.
Hoe zullen wereldmodellen de rol van AI in de samenleving veranderen?
Wereldmodellen zullen de rol van AI transformeren van een louter beschrijvend systeem naar een ondersteunende agent die kan samenwerken met mensen, bijvoorbeeld in wetenschappelijk onderzoek en dagelijkse toepassingen.
