Het Spaanse hooggerechtshof heeft een cassatieberoep afgewezen onder het voorwendsel dat het door kunstmatige intelligentie (AI) was gegenereerd. Een opmerkelijke toegepaste ironie doet zich voor: dezelfde AI-tool die de rechtbank gebruikte, gaf aan dat het oordeel zelf ook een aanzienlijk aandeel aan AI-invloed vertoonde. Dit roept vragen op over de betrouwbaarheid van technologie die tot doel heeft rechtspraak te ondersteunen.
In het licht van deze onthullingen doet de vraag zich voor of we te maken hebben met een dubbele moraal binnen de rechtbank of met ineffectieve technologieën. De rechtbank voerde aan dat zij, geconfronteerd met vermoedens dat de indiening door de advocaat niet zelf was opgemaakt, de tekst door de Winston AI-tool liet analyseren. De uitkomst was onthullend: slechts 7% van de inhoud zou menselijk zijn, hetgeen volgens de rechtbank wijst op een dominantie van geautomatiseerd schrijven. Dit leidde tot de conclusie dat het document niet als een geldig pleidooi kon worden erkend.
Echter, na kritische beoordeling door juridische experts die ook de uitspraak verwerkten met AI-detectiesoftware, raakten zij in de verlegenheid dat de rechtbank zelf met soortgelijke aantijgingen geconfronteerd werd. Advocaat Emmanuel Alessio Velasquez haalde op X aan dat het oordeel 93% AI-gegenereerde tekst bevatte. Het is overduidelijk dat het gebruik van dergelijke detectietools meer vragen oproept over hun methodologische validiteit dan dat het daadwerkelijk bijdraagt aan een rechtvaardige rechtsgang.
De snelle reactie vanuit de juridische gemeenschap op deze ontwikkelingen is opmerkelijk. Er zijn experimenten uitgevoerd met vroegere documenten, waaronder een rechtbankindiening uit 2019 die, hoewel voorafgaand aan de opkomst van enkele AI-modellen, eveneens als voor een schokkende 95% AI-gebaseerd werd aangemerkt. Dit onthult niet alleen de tekortkomingen van de detectie-instrumenten, maar wijst ook op een meer algemene onbetrouwbaarheid. De tools genereren analyses die sterk afhankelijk zijn van statistische patronen – zoals zinslengte en voorspelbaarheid van vocabulaire – die vaak ook kenmerkend zijn voor formeel juridisch schrijven. Hierdoor worden vaak de meest formele en zorgvuldig geschreven teksten onterecht als problematisch bestempeld.
Een studie uit 2023 gepubliceerd in “Patterns” toont aan dat meer dan 61% van de essays van niet-native Engelse sprekers onterecht als AI-gegenereerd werd gemarkeerd. Een systematische beoordeling door Weber-Wulff in datzelfde jaar concludeerde dat geen van de beschikbare tools zowel accuraat als betrouwbaar is. Bekende platforms zoals Turnitin meldden zelfs dat hun detector hogere percentages van fout-positieven opriep wanneer het AI-gehalte in documenten onder de 20% lag. In sommige gevallen hebben instellingen zoals de Vanderbilt University besloten om AI-detectie helemaal uit te schakelen na te zijn geconfronteerd met duizenden foutieve positieven.
De culturele gevolgen hiervan zijn opvallend en absurd. Sociaal schrijvers vermijden nu bepaalde schrijfstijlen of interpuncties – zoals het gebruik van em-dashes – simpelweg uit angst voor onterecht gemarkeerde teksten. De huidige situatie binnen Colombia vraagt om nadenken over de onverenigbaarheid tussen traditionele juridische methoden en de toenemende afhankelijkheid van algoritmische hulpmiddelen. De recente beslissingen, zoals de zaak waarin een advocaat werd aangestraft voor het aanhalen van niet-bestaande AI-gebaseerde precedenten, tonen aan dat de juridische wereld langzaam maar zeker deze nieuwe realiteit moet omarmen, terwijl zij tegelijkertijd de fundamenten van gerechtigheid en menselijke inspectie behoudt.
Colombia’s rechters hebben in december 2024 richtlijnen vastgesteld die stipuleren hoe rechters en rechtbankpersoneel AI mogen gebruiken. Deze richtlijnen staan het gebruik van AI toe voor administratieve taken, maar leggen strenge beperkingen op wanneer het aankomt op juridische besluitvorming. De nadruk ligt duidelijk op het feit dat menselijke rechters de ultieme verantwoordelijkheid dragen en dientengevolge transparant moeten zijn over het gebruik van AI in de voorbereiding van juridische documenten.
Waarom zijn AI-detectietools niet betrouwbaar?
AI-detectietools zijn niet betrouwbaar omdat ze werken op basis van statistische patronen die ook voorkomen in menselijke teksten. Hierdoor kunnen formele of specifiek geschreven documenten onterecht als AI-gegenereerd worden aangemerkt.
Wat zijn de gevolgen van het gebruik van deze tools in de rechtszaal?
Het gebruik van AI-detectietools in de rechtszaal kan leiden tot onterechte rechtsbeslissingen, wat de toegang tot rechtvaardigheid in gevaar brengt. Documenten kunnen onterecht als ongeldig worden bestempeld, wat schadelijk is voor alle betrokken partijen.
Hoe gaat de juridische sector om met de opkomst van AI?
De juridische sector past zich aan door richtlijnen op te stellen voor het gebruik van AI, waarbij menselijke controle en verantwoordelijkheid centraal staan. Het is essentieel om een balans te vinden tussen technologische innovatie en de noodzaak voor menselijke beoordeling in juridische processen.
