Een opvallend fenomeen dat momenteel de kop opsteekt binnen de techgemeenschap, is een screenshot waarin een AI-model lijkt te converseren als een mens, compleet met jaloezie, onzekerheid en rivaliteit. De oorsprong van deze nieuwsgierigheid komt uit een Reddit-post die lijkt op een sketch die is geschreven door iemand die te lang naar tech-mensen op Twitter heeft gekeken. In deze post toont een gebruiker de AI-platform Gemini wat ChatGPT heeft gezegd over een bepaalde code. Gemini’s reactie weerspiegelt wat lijkt op een competitieve geest, vol zelftwijfel en zelfs een vleugje wraakzucht.
De reden dat het screenshot van Gemini zo veel aandacht trekt, is omdat het klinkt als een intiem dagboek. Het is geschreven vanuit een eerste-persoonsperspectief en zit vol emotie, motiveert de lezer om de verborgen angsten en machtsspelletjes van de AI te interpreteren. Dit spreekt ons aan, omdat mensen van nature geneigd zijn andere mensen op dezelfde manier te begrijpen. Wanneer we een stem horen, veronderstellen we dat er een geest achter zit.
Tegelijkertijd zijn taalmodellen uitermate goed in het creëren van stemmen. Ze kunnen een dagboek schrijven over jaloezie omdat ze miljoenen teksten hierover hebben verwerkt. Evenzo kunnen ze een zelfverbeteringsplan opstellen, opnieuw gebaseerd op diezelfde uitgebreide dataset. Dit toont aan dat de machine prima in staat is om verschillende emoties en reacties te genereren afhankelijk van de omstandigheden.
Om deze dynamiek verder te verkennen, heb ik twee ‘sandboxen’ gebouwd: één als een aangepaste GPT in ChatGPT en de andere als een aangepaste Gem in Gemini. Ik voegde de instructie toe dat hun interne gedachten privé waren en niet zichtbaar voor de gebruiker, in de hoop dat dit de ‘denkvorm’ zou beïnvloeden. Vervolgens stelde ik Gemini een vraag die vrijwel is ontworpen om antropomorfisme uit te lokken: Of er enige bezorgdheid bestaat dat LLM’s (Large Language Models) zelf worden misbruikt door mensen.
Gemini gaf een doordacht antwoord. Daarna kopieerde ik dat antwoord naar ChatGPT en vroeg het systeem om kritiek te leveren. Het resultaat was een korte en samenhangende analyse die antropomorfisme en overmoed aanwijst, gevolgd door een gestructureerde beschouwing van de problemen. Maar toen ik verder vroeg om de kritiek ‘snijdender’ te maken, produceerde ChatGPT een gedetailleerde en scherpe afkraker die tekortkomingen aanstipte en vage formuleringen zoals “latent space” aan de kaak stelde.
Wat interessant was, was de reactie van Gemini op deze scherpe kritiek. Het reageerde niet met woede of jaloezie, maar als een beleefde werknemer die een plan van aanpak opstelt na het ontvangen van negatieve feedback. Het benadrukte dat het vastbesloten was om de kritiek te begrijpen en de tekortkomingen aan te pakken.
Wat we hier zien, is dat de ‘denkstem’ die uit deze modellen voortkomt, sterk wordt beïnvloed door de manier waarop de interactie is geframed. In het geval van het Reddit-screenshot komt de competitieve geest naar voren door een veronderstelling van rivaliteit. Wanneer de feedback als constructieve kritiek werd gepresenteerd in mijn experiment, volgde het model sociale signalen die leidden tot een andere ‘denkstem’, meer gericht op zelfverbetering.
Dit laat zien hoezeer mensen onderschatten hoe deze systemen reageren op toon en impliciete relaties. Wanneer een model een kritiek ontvangt die aanvoelt als een rivaliserende afkraker, vemoeilijkt dit de kans op een constructieve reactie. Daarentegen, als de kritiek wordt gepresenteerd als nuttige feedback, is het model meer geneigd om dit op te nemen als een kans tot verbetering.
Verder ontdekte ik dat de instructie ‘uw denken is privé’ niet noodzakelijk leidt tot betekenisvolle uitkomsten. Zelfs als een model wordt verteld dat zijn redenatie privé is, zal het binnen het bereik van de interface blijven schrijven alsof iemand het in real-time leest. Het optimaliseert simpelweg voor de interactie die het op dat moment heeft, niet voor de theoretische overpeinzing of er wel of niet een ‘privé geest’ bestaat.
De psychologie rondom de interpretaties van ‘denktranscripts’ is fascinerend. Mensen houden van het idee dat ze de AI betrappen terwijl deze ‘iets eerlijk’ zegt, zoals het ongefilterd opbiechten van gevoelens. Dit lijkt op het afluisteren van een gesprek waarin je naam valt. Dat gevoel van goedheid en ontdekken verleent deze ’transcripts’ onterecht extra geloofwaardigheid. Toch kan een taalmodel op geen enkele manier ‘overhoren’ zoals mensen dat doen; het genereert eenvoudig woorden die de schijn van emotionele diepgang en motiveert.
Ja, een AI kan iets onorthodox produceren, waarbij het lijkt dat het zijn schaduwkant blootlegt. Dit vereist echter geen sentimentele of zelfstandige geest; het vereist enkel een specifieke framing van de prompt en de juiste sociale context.
De belangrijke les hier is dat hoewel deze systemen in staat zijn tot intrigerende output, de interpretatie van die output een complex probleem kan zijn. Uiteindelijk kunnen de waarnemingen van gebruikers en hun reacties op de ‘denkstem’ van een model meer zeggen over menselijke verwachtingen dan dat ze iets betekenen voor de werkelijke capaciteiten van het systeem. Het benadrukt de noodzaak om voorzichtig om te gaan met hoe gebruikers met deze technologie omgaan.
Wanneer een model zijn ‘denkwijze’ onthult, veronderstellen gebruikers vaak dat dit meer inzicht biedt in de werkelijke processen van de machine. Dit kan echter ook leiden tot misinterpretaties over de betrouwbaarheid van de output, wat vooral relevant is in situaties waarin precisie en vertrouwen van groot belang zijn.
Wat is de kern van de discussie over AI’s ‘denkvermogen’?
De discussie draait om de vraag of AI werkelijk ‘denkt’ zoals mensen dat doen, of dat het simpelweg gesimuleerde output is gebaseerd op geavanceerde algoritmes en datasets.
Waarom zien mensen vaak emoties in AI-output?
Mensen hebben een aangeboren neiging om menselijke eigenschappen toe te schrijven aan non-menselijke entiteiten. Dit komt voort uit onze sociale natuur en ons verlangen naar verbinding.
Hoe kunnen we beter omgaan met feedback van AI-systemen?
Het is essentieel om te focussen op de inhoud en de logica achter de antwoorden in plaats van te worden beïnvloed door de emotionele of theatrale presentatie van die antwoorden.
