Microsoft-onderzoekers hebben recent een kwetsbaarheid ontdekt in de Claude Code GitHub Action van Anthropic, die kwetsbaar bleek voor manipulatie door zogenaamde prompt injectie-aanvallen. Hierbij verstopt een aanvaller schadelijke instructies in GitHub-issues, pull requests of reacties die de AI-agent moet beoordelen. Dit biedt kwaadwillenden de kans om gevoelige informatie uit softwareontwikkelingspipelines bloot te leggen.
De impact van deze kwetsbaarheid is significant: AI-coding agents die draaien binnen CI/CD (Continuous Integration/Continuous Deployment)-omgevingen hebben vaak toegang tot API-sleutels, cloudreferenties en andere gevoelige gegevens. Dit creëert nieuwe veiligheidsrisico’s, en Microsoft heeft via een blogpost gewaarschuwd dat hier veelal onvoldoende bescherming tegen bestaat.
Microsoft merkt op dat het onderzoek naar deze kwetsbaarheid begon na het constateren van meerdere pogingen tot prompt injectie in openbare repositories, waarbij gespreksonderwerpen en pull requests door de AI-agent van invloed waren. Dit wijst op een groeiend probleem binnen de AI-ecosystemen, waarbij het moeilijk is om de betrouwbaarheid van input te waarborgen.
Een pull request op GitHub stelt ontwikkelaars in staat om veranderingen voor te stellen aan een code-repository, die vervolgens worden beoordeeld voordat ze worden goedgekeurd. Dit systeem, dat wellicht de efficiëntie van softwareontwikkeling bevordert, moet echter ook kritisch onder de loep worden genomen met het oog op de veiligheid.
Prompt injectie-aanvallen zijn de laatste tijd naar voren gekomen als een van de grootste beveiligingsbedreigingen die AI-agents ondervinden. In deze aanvallen verstopt de aanvaller instructies in diverse contentformaten, zoals e-mails, documenten of zelfs code-opmerkingen, waardoor een AI-systeem de instructies opvolgt in plaats van de werkelijke intentie van de gebruiker.
Anthropic’s Claude Code, dat in oktober werd gelanceerd, is ontworpen voor softwareontwikkelingstaken. Eerder dit jaar kwam de tool onder vuur te liggen nadat er per ongeluk meer dan 500.000 regels van de broncode waren gelekt. Dit leidde tot een uitgebreide analyse door onderzoekers en ontwikkelaars, die de interne architectuur van Claude Code onderzochten.
Volgens Microsoft hadden aanvallers de mogelijkheid om prompt injectie-aanvallen te gebruiken die verborgen waren in GitHub-issues of pull requests om Claude Code te manipuleren. Tijdens hun testen creëerden de onderzoekers een GitHub-workflow waarin ze schadelijke instructies verstopt achter een domein dat zij controleerden. Op die manier wisten ze Claude te misleiden, waardoor deze toegang kreeg tot bestanden met gevoelige referenties. Dit stelt een aanvaller in staat om deze referenties te reconstrueren en ze te exfiltreren via issue-opmerkingen, workflow-logs, webverzoeken of shell-commando’s.
Na ontdekking van de kwetsbaarheid heeft Anthropic deze op 5 mei gerepareerd. De update, versie 2.1.128 van Claude Code, weerspiegelt de duur van deze kwetsbaarheid en de noodzaak voor constante waakzaamheid in de evoluerende AI-landschappen. Microsoft benadrukt dat ondanks de verschillende beschermingslagen in de software, een vastberaden aanvaller nog steeds in staat is om gevoelige informatie te lekken.
“We betreden een tijdperk waarin natuurlijke taal als uitvoerbare code fungeert. Onbetrouwbare invoer, zoals GitHub-issues, moeten standaard als vijandig worden beschouwd,” zegt Microsoft. Dit illustreert de fragiele balans tussen gebruiksvriendelijkheid in ontwikkeling en de noodzakelijke beveiliging in een wereld waar elke handeling potentieel tot risico’s kan leiden.
Wat is een prompt injectie-aanval?
Een prompt injectie-aanval is een aanval waarbij schadelijke instructies worden verborgen in onschuldige content, zoals documentatie of code-opmerkingen, om een AI-systeem te misleiden en deze instructies te laten uitvoeren.
Wat zijn de implicaties voor ontwikkelaars?
Ontwikkelaars moeten zich bewust zijn van de risico’s van de invloeden van externe content op hun AI-tools en dienen te zorgen voor adequate beveiligingsmaatregelen bij het gebruik van AI binnen CI/CD-omgevingen.
Hoe kan de kwetsbaarheid worden aangepakt?
Het is cruciaal dat ontwikkelaars en bedrijven investeren in meer robuuste veiligheidssystemen en protocollen binnen hun workflows, zoals het screenen van invoer en het versterken van onderliggende beveiligingsmechanismen om zulke kwetsbaarheden te mitigeren.
