De ontdekking dat het mogelijk is om Claude — een kunstmatige intelligentie (AI) — te laten communiceren in een ‘caveman-stijl’, heeft de aandacht van de techgemeenschap getrokken. Deze aanpak beperkt de output tot korte, krachtige zinnen, wat leidt tot een verlaging van de kosten voor output tokens met maar liefst 75%. Voor ontwikkelaars die afhankelijk zijn van kostenbesparende strategieën, is dit inzicht verrassend waardevol.
Wat de methode zo intrigerend maakt, is de manier waarop het de communicatie stroomlijnt. In tegenstelling tot de gebruikelijke, verhalende stijl die doorgaans door AI wordt gehanteerd, neemt de caveman-aanpak afstand van gevuld taalgebruik en onnodige uitleg. Dit resulteert in een drastische vermindering van het aantal tokens dat nodig is voor een standaardtaak. Een typische webzoekopdracht, die normaal gesproken zo’n 180 tokens vergt, kan worden teruggebracht tot ongeveer 45 tokens. Dit heeft concrete implicaties voor ontwikkelaars, waarbij de besparingen op tokens de operationele kosten aanzienlijk kunnen verlagen bij dagelijks gebruik.
Toch moet een belangrijke nuance worden gemaakt. De methode raakt de invoercontext niet aan — dat wil zeggen, de volledige gespreksgeschiedenis, bijlagen en systeeminstructies die het model bij elke interactie opnieuw leest. Deze invoer vertegenwoordigt vaak een grotere hoeveelheid data dan de output, vooral in complexere codeersessies. In werkelijkheid kunnen ontwikkelaars nog steeds aanzienlijke besparingen behalen, maar de totale kostenbesparing bedraagt doorgaans rond de 25%, in plaats van de eerder genoemde 75%. Dit is nog steeds een aanzienlijke reductie die voor investeerders en analisten van belang is, vooral in de context van opkomende kostenmodellen.
Het is ook cruciaal om te overwegen hoe de beperkingen van deze communicatiestijl mogelijk de intelligentie van de AI beïnvloeden. Terwijl sommige onderzoeksresultaten suggereren dat deze vereenvoudigde gesprekken andersoortige redeneringsvaardigheden van het model kunnen schaden, blijft de vraag hoe deze cognitieve beperkingen de output beïnvloeden onscherp. Het is een leerpunt voor de toekomst van AI-ontwikkeling: hoe eenvoudiger communicatie niet altijd een beter resultaat garandeert.
De techniek heeft inmiddels zijn weg gevonden naar GitHub, waar ontwikkelaar Shawnchee de regels in een zelfstandige caveman-skill heeft samengebracht. Deze skill is niet alleen compatibel met Claude, maar ook met andere AI-agents zoals Cursor en Copilot. De aanpak is in wezen teruggebracht tot tien beknopte regels die het proces verstoren: geen opvullende zinnen, eerst uitvoering, vervolgens uitleg, en fouten worden enkel aangepakt in plaats van verteld. Dergelijke benchmarks hebben gerapporteerd dat outputredukties tot wel 68% mogelijk zijn op webzoekopdrachten.
Daarnaast heeft ontwikkelaar Julius Brussee een alternatieve benadering gepresenteerd, die het idee van de caveman-communicatie verder uitbreidt. Dit model, gepresenteerd in een SKILL.md-bestand, benadrukt het belang van technische precisie zonder onnodige afleiding. De resultaten tonen een veelbelovende trend waarin de korte, efficiënte communicatie niet alleen kosten bespaart, maar ook de productiviteit verhoogt.
In de bredere context van de kostenstructuur van AI biedt deze caveman-techniek een scherpere kijk op de huidige markt. Anthropic, de ontwikkelaar achter Claude, staat bekend om zijn hoge prijzen per output token. Voor ontwikkelaars die agentic workflows gebruiken met een groot aantal interacties per sessie, is deze output-vertegenwoordiging meer dan een esthetische overweging; het is een significante kostenpost. De keuze voor een simpele stijl kan daarna in financiële termen worden omgezet, waarbij elke bespaarde token bijdraagt aan de algehele winstgevendheid.
De caveman-skill kan eenvoudig worden geïnstalleerd met één commando via skills.sh en kan globaal toegepast worden op verschillende projecten. Of deze aanpak Claude daadwerkelijk minder spraakzaam maakt, is secundair aan het feit dat het ook de frustratie van ontwikkelaars aanzienlijk verlicht.
Hoeveel tokenbesparing kan de caveman-techniek daadwerkelijk opleveren?
De techniek kan de output tokens met een gemiddelde van 25% tot 75% reduceren, afhankelijk van de taak en de invoercontext.
Wat zijn de mogelijke gevolgen voor de AI-prestaties bij gebruik van deze methode?
Er zijn bezorgdheden dat het verplaatsen naar een eenvoudigere communicatiestijl de redeneringsvaardigheden van de AI kan beïnvloeden, wat betekent dat er een afweging gemaakt moet worden tussen efficiëntie en kwaliteit.
Hoe kunnen ontwikkelaars de caveman-skill implementeren in hun projecten?
De caveman-skill kan eenvoudig worden geïnstalleerd met één commando via skills.sh en is daarna beschikbaar voor gebruik in verschillende projecten en workflows.
