Kunstmatige intelligentie (AI) is slechts een schim zonder menselijke expertise op het gebied van datamanagement en trainingsmethoden. Ondanks de aanzienlijke groeiprognoses, zullen innovaties binnen AI niet relevant zijn als ze blijven voortbouwen op data van slechte kwaliteit.
Buiten de verbetering van datastandaarden, vereisen AI-modellen menselijke interventie voor contextueel begrip en kritisch denken. Dit is essentieel om ethische AI-ontwikkeling te waarborgen en correcte output te genereren.
Mensen beschikken over een genuanceerd bewustzijn en baseren hun beslissingen op ervaring en logisch nadenken. AI-modellen zijn echter slechts zo goed als de data waarmee ze zijn getraind.
De nauwkeurigheid van een AI-model is niet louter afhankelijk van de technische verfijning van de onderliggende algoritmes of de hoeveelheid verwerkte data. Echte nauwkeurigheid is afhankelijk van betrouwbare, hoogwaardige data tijdens de training en bij analytische prestatiebeoordelingen.
Slechte data heeft verstrekkende gevolgen voor de training van AI-modellen. Het genereert vooringenomen output en hallucinatielogica, wat leidt tot tijdsverlies doordat AI-modellen opnieuw moeten worden getraind om ongewenste gewoonten af te leren, wat de kosten voor bedrijven verhoogt.
Vooringenomen en statistisch ondervertegenwoordigde data verergeren gebreken en vertekeningen in AI-systemen, vooral in sectoren zoals gezondheidszorg en beveiliging.
Een rapport van het Innocence Project vermeldt meerdere gevallen van onjuiste identificatie, waarbij een voormalige chef van de politie van Detroit toekende dat het vertrouwen op AI-gebaseerde gezichtsherkenning zou leiden tot 96% onjuiste identificaties. Verder blijkt uit een rapport van Harvard Medical School dat een AI-model dat in Amerikaanse gezondheidsystemen werd gebruikt, gezondere blanke patiënten prioriteit gaf boven zieke zwarte patiënten.
AI-modellen volgen het principe van “Garbage In, Garbage Out” (GIGO), waarbij gebrekkige en vooringenomen datainvoeren leiden tot slechte output. Slechte invoerdata creëert operationele inefficiënties, aangezien projectteams vertraging oplopen en hogere kosten maken om datasets schoon te maken voordat ze met de modeltraining kunnen doorgaan.
Naast de operationele impact ondermijnen AI-modellen die zijn getraind op slechte data het vertrouwen van bedrijven in hun inzet, wat kan leiden tot onherstelbare reputatieschade. Volgens een onderzoek waren de hallucinatiepercentages voor GPT-3.5 39,6%, wat de noodzaak van extra validatie door onderzoekers benadrukt.
Dergelijke reputatieschade heeft verstrekkende gevolgen, aangezien het moeilijk wordt om investeringen te verkrijgen en de markpositie van het model beïnvloedt. Tijdens een CIO Network Summit gaf 21% van de top IT-leiders in Amerika aan dat een gebrek aan betrouwbaarheid hun belangrijkste reden was om geen AI te gebruiken.
Slechte data voor de training van AI-modellen devalueert projecten en veroorzaakt enorme economische verliezen voor bedrijven. Gemiddeld leidt onvolledige en slechte kwaliteit van AI-trainingsdata tot verkeerde besluitvorming die bedrijven 6% van hun jaarlijkse omzet kost.
De problematiek rondom slechte datakwaliteit beïnvloedt AI-innovatie en modeltraining, waardoor het cruciaal is om alternatieve oplossingen te zoeken.
Dit ‘slechte data’-probleem heeft AI-bedrijven gedwongen wetenschappers te herschikken en richtte hen op het voorbereiden van datasets. Bijna 67% van de datawetenschappers besteedt hun tijd aan het voorbereiden van correcte datasets om verkeerde informatie van AI-modellen te voorkomen.
AI- en machine learning-modellen kunnen moeite hebben om relevante output te leveren, tenzij er specialisten — echte mensen met de juiste kwalificaties — betrokken zijn bij het verfijnen van deze modellen. Dit onderstreept de noodzaak van menselijke experts om de ontwikkeling van AI te begeleiden en ervoor te zorgen dat er hoogwaardige gecureerde data beschikbaar is voor de training van AI-modellen.
Elon Musk heeft onlangs opgemerkt dat “de cumulatieve som van menselijke kennis is uitgeput in de training van AI.” Dit is een onjuiste aanname: menselijke frontierdata zijn cruciaal voor het ontwikkelen van sterkere, betrouwbaardere en onbevooroordeelde AI-modellen.
Musk’s afwijzing van menselijke kennis roept op tot het gebruik van kunstmatig geproduceerde synthetische data voor het verfijnen van AI-modellen. In tegenstelling tot mensen mist synthetische data echter de ervaring uit de werkelijkheid en heeft het historisch gezien gefaald in het maken van ethische oordelen.
Menselijke expertise zorgt voor een zorgvuldige beoordeling en validatie van data, waarmee de consistentie, nauwkeurigheid en betrouwbaarheid van AI-modellen worden gewaarborgd. Mensen kunnen de output van een model evalueren, beoordelen en interpreteren om vooroordelen of fouten te identificeren en ervoor te zorgen dat ze in lijn zijn met maatschappelijke waarden en ethische standaarden.
Bovendien biedt menselijke intelligentie unieke inzichten tijdens de voorbereiding van data door contextueel referentiekader, gezond verstand en logisch redeneren aan data-interpretatie toe te voegen. Dit helpt bij het oplossen van ambiguïteit, het begrijpen van nuances en het aanpakken van problemen binnen de complexe training van AI-modellen.
De symbiotische relatie tussen kunstmatige en menselijke intelligentie is van cruciaal belang om het potentieel van AI als transformerende technologie te benutten zonder schade aan de samenleving te berokkenen. Een samenwerkingsgerichte aanpak tussen mens en machine opent de deur naar menselijke intuïtie en creativiteit voor het ontwikkelen van nieuwe AI-algoritmes en -architecturen ten behoeve van het algemeen belang.
Decentraliserende netwerken zouden het ontbrekende stuk kunnen zijn om deze relatie op wereldschaal te verankeren.
Bedrijven verspillen tijd en middelen wanneer ze zwakke AI-modellen hebben die constante verfijning vereisen van datawetenschappers en ingenieurs. Door gebruik te maken van decentrale menselijke interventie kunnen bedrijven kosten verlagen en de efficiëntie verhogen door het evaluatieproces te spreiden over een wereldwijd netwerk van datatrainers en -bijdragers.
Decentrale versterkingsleer op basis van menselijke feedback (RLHF) transformeert de training van AI-modellen in een collaboratieve onderneming. Gewone gebruikers en vakexperts kunnen bijdragen aan de training en financiële prikkels ontvangen voor nauwkeurige annotaties, labeling en classificatie.
Een blockchain-gebaseerd decentraal mechanisme automatiseert de compensatie, aangezien bijdragers beloningen ontvangen op basis van meetbare verbeteringen van de AI-modellen in plaats van op rigide quota of benchmarks. Verder democratiseert decentrale RLHF data en modeltraining door mensen uit diverse achtergronden te betrekken, waardoor structurele vooroordelen verminderd worden en de algemene intelligentie wordt verbeterd.
Volgens een Gartner-enquête zullen bedrijven tegen 2026 meer dan 60% van hun AI-projecten verlaten wegens het gebrek aan AI-vriendelijke data. Daarom zijn menselijke vaardigheden en competenties cruciaal voor het voorbereiden van trainingsdata voor AI, wil de sector naar verwachting $15,7 biljoen bijdragen aan de wereldeconomie tegen 2030.
De datainfrastructuur voor de training van AI-modellen vereist voortdurende verbetering op basis van nieuwe en opkomende data en gebruiksgevallen. Mensen kunnen ervoor zorgen dat organisaties een AI-vriendelijke database onderhouden door voortdurende metadata-beheer, waarneembaarheid en governance.
Zonder menselijke supervisie zullen bedrijven in de problemen komen met de enorme hoeveelheid data die is opgesloten in cloud- en offshore datanetwerken. Het is noodzakelijk dat bedrijven een “humaan-in-de-lus”-aanpak hanteren om datasets te verfijnen voor het creëren van hoogwaardige, presterende en relevante AI-modellen.
Hoe beïnvloedt slechte data de prestaties van AI-modellen?
Slechte data kan leiden tot onbetrouwbare en bevooroordeelde resultaten. AI-modellen die met dergelijke data zijn getraind, kunnen dus niet de gewenste nauwkeurigheid of betrouwbaarheid bieden, wat leidt tot verkeerde besluitvorming en reputatieschade voor bedrijven.
Waarom is menselijke interventie noodzakelijk in AI-training?
Menselijke experts zijn cruciaal voor het waarborgen van de kwaliteit en ethiek van AI. Zij bieden contextueel begrip, evalueren resultaten en helpen vooroordelen te identificeren en te corrigeren, wat de algehele effectiviteit van het AI-model bevordert.
Wat is de rol van decentralisatie in AI-training?
Decentralisatie maakt het mogelijk om de evaluatie en training van AI-modellen over een wereldwijd netwerk van data trainers en bijdragende individuen te spreiden. Dit vergroot de efficiëntie en vermindert kosten, terwijl het ook bijdraagt aan een bredere diversiteit van perspectieven in de data training.
Hoewel de toekomst van AI veelbelovend is, laat de huidige afhankelijkheid van kwalitatief zwakke data te wensen over. Door te investeren in menselijke expertise en decentrale structuren kunnen we AI-modellen ontwikkelen die niet alleen effectiever zijn, maar ook bijdragen aan een ethische en duurzame toekomst voor deze technologie.
