De artificial intelligence (AI) onderneming Anthropic heeft aangekondigd dat zij de publieke toegang tot haar geavanceerde AI-modellen, Claude Fable 5 en Mythos 5, zal heropenen. Dit gebeurt enkele weken nadat deze modellen onder druk van de Amerikaanse overheid offline werden gehaald.
Sinds 12 juni was de toegang tot deze modellen beperkt, naar aanleiding van een rapport waarin onderzoekers de beveiligingsmaatregelen van Fable 5 konden omzeilen. Dit incident dwong Anthropic om onmiddellijk alle toegang tot de modellen te beëindigen. Inmiddels heeft de overheid deze beperkingen opgeheven, aldus Anthropic.
“Na een reeks constructieve gesprekken met de Amerikaanse overheid kunnen we het model opnieuw inzetten met een nieuwe set classifiers die gericht zijn op het blokkeren van meer cybersecurity-taken,” meldde Anthropic.
Het stopzetten van de modellen heeft vragen doen rijzen over de rol van de staat in de controle over toonaangevende AI-technologie en vormt, zo stellen experts, een gevaarlijk precedent. De exportcontroles benadrukten bovendien de zorgen van het Witte Huis over een mogelijke nationale cybersecuritydreiging, vooral als deze krachtige modellen zouden worden gekraakt en kwaadaardig gebruikt.
Howard Lutnick, de Amerikaanse minister van Handel, verklaarde op X dat er in de afgelopen twee weken nauw is samengewerkt met Anthropic om Fable 5 te analyseren en goed te keuren, met als doel eenheid binnen de Amerikaanse overheid te waarborgen en de leiderschapspositie van Amerika in AI te versterken.
White House Chief of Staff Susie Wiles voegde daaraan toe dat de prioriteit van de overheid blijft om de beste AI-technologie zo snel en veilig mogelijk in te zetten.
Eerder kwamen de beperkingen voort uit een rapport waarin Amazon-onderzoekers een manier ontdekten om de beveiligingen van Fable 5 te omzeilen, wat leidde tot het identificeren van diverse softwarekwulnerabiliteiten.
Anthropic betoogde in een blogpost dat dit niet een risico is dat uniek is voor Fable 5; ook minder geavanceerde modellen kunnen dezelfde kwetsbaarheden blootleggen en soortgelijke exploits genereren.
Anthropic is ook bezig met het opstellen van een consensusframework in samenwerking met Amazon, Microsoft, Google en andere partners in haar Project Glasswing, een samenwerking die in april werd aangekondigd om bedreigingen vanuit AI op het gebied van cybersecurity te mitigeren. Dit framework zal dienen voor het “beoordelen van de ernst van AI-jailbreaks”.
Het bedrijf breidt zijn samenwerking met de Amerikaanse overheid verder uit op het gebied van testen van AI-modellen en beveiligingsmaatregelen. Dit omvat voorafgaande toegang tot modellen en veiligheidsmaatregelen, informatie-uitwisseling over jailbreaks en misbruik, evenals gereserveerde middelen voor gezamenlijk onderzoek.
Een bekende AI-onderzoeker heeft beweerd dat hij Fable 5 binnen 48 uur na de lancering in juni heeft gekraakt, voordat de overheidsbeperkingen van kracht werden, en toonde screenshots die laten zien hoe hij de veiligheidsmaatregelen van het model wist te omzeilen.
Hoe heeft de Amerikaanse overheid gereageerd op de problemen met Fable 5?
De overheid heeft exportcontroles ingesteld en de toegang tot de modellen beperkt om mogelijke cybersecuritydreigingen te voorkomen nadat onderzoekers beveiligingsmaatregelen hadden omzeild.
Wat houdt de samenwerking van Anthropic met andere techbedrijven in?
Anthropic werkt aan een consensusframework met techgiganten zoals Amazon en Microsoft om de ernst van jailbreaks te beoordelen en gezamenlijke inspanningen te bevorderen tegen cybersecuritybedreigingen.
Wat zijn de implicaties van het weer opengaan van de modellen voor investeerders?
Het herstel van de publieke toegang kan mogelijkheden creëren voor investeerders, aangezien een bredere toepassing van AI-technologie in sectoren als cybersecurity nieuwe marktkansen opent en tegelijkertijd ook risico’s met zich meebrengt zonder adequate veiligheidsmaatregelen.
