De recente lancering van open-source modellen door twee Amerikaanse AI-laboratoria illustreert de toenemende strijd om het leiderschap in de open-source AI sector. Deep Cognito presenteerde Cogito v2.1, een indrukwekkend model met maar liefst 671 miljard parameters. De oprichter, Drishan Arora, beschrijft het als “het beste open-weight LLM (Large Language Model) van een Amerikaans bedrijf.” Deze uitspraak stuitte echter op enige weerstand van het Allen Institute for AI, dat simultaan Olmo 3 lanceerde en het bestempelt als “het beste volledig open basismodel.” Olmo 3 biedt volledige transparantie, inclusief trainingsdata en broncode.
Ironisch genoeg is de basis van Cogito v2.1 afgeleid van een Chinees model, Deepseek, wat leidde tot kritische opmerkingen. Arora bevestigde dat dit model is voortgekomen uit een open-licensed variant uit november 2024. Dit zette de discussie weer aan over de vraag of het verfijnen van een Chinees model daadwerkelijk een Amerikaanse vooruitgang in AI vertegenwoordigt, of simpelweg reflecteert hoe ver Amerikaanse laboratoria achter zijn geraakt.
Desondanks zijn de efficiëntiewinsten van Cogito aanzienlijk. Het bedrijf claimt dat Cogito v2.1 met 60% kortere redeneerschakels werkt dan DeepSeek R1, terwijl de prestaties competitief blijven. Door gebruik te maken van een methode die Arora beschrijft als “Iterated Distillation and Amplification” – waarbij modellen beter leren door zelfverbeteringsloops – werd het model in slechts 75 dagen getraind met infrastructuur van RunPod en Nebius. Mocht deze claim waar blijken te zijn, dan zou dit de krachtigste open-source LLM zijn die momenteel door een Amerikaans team wordt onderhouden.
Tot nu toe heeft China de standaard gezet in open-source AI, waardoor Amerikaanse bedrijven steeds vaker afhankelijk zijn van Chinese basismodellen, zowel privé als openbaar. Deze dynamiek is riskant. Mocht Chinese technologie de standaard worden voor open AI wereldwijd, dan verliezen Amerikaanse startups hun technische onafhankelijkheid en onderhandelingspositie, evenals hun vermogen om normen in de sector vast te stellen.
De controle over open-weight AI bepaalt wie de benodigde modellen beheert waarop alle downstream producten zijn gebaseerd. Op dit moment domineren Chinese open-source modellen zoals DeepSeek, Qwen, Kimi en MiniMax wereldwijd, voornamelijk vanwege hun lage kosten, snelheid en hoge efficiëntie. Hierdoor bouwen veel Amerikaanse startups hun diensten op deze modellen, ook al willen ze dat publiekelijk niet altijd toegeven. Dit houdt in dat ze afhankelijk zijn van buitenlandse intellectuele eigendomsrechten en infrastructuur, wat strategisch licht doet denken aan de vroegere Amerikaanse afhankelijkheid van halfgeleiderfabricage.
Deep Cognito’s keuze om met een DeepSeek-fork te starten toont zowel de voordelen van snelle iteratie als de nadelen van afhankelijkheid. Het Allen Institute daarentegen, heeft een andere aanpak gekozen door Olmo 3 te ontwikkelen met volledige transparantie. Dit toont aan dat, wil de VS leidend blijven in open AI, ze het gehele proces zelf moet opbouwen, van data tot trainingsrecepten en checkpoints. Dit is een arbeidsintensief en langzaam proces, maar biedt de garantie van onafhankelijkheid over de onderliggende technologie.
Wie gewend is aan DeepSeek zal merken dat Cogito meestal betere antwoorden levert. Voor API-gebruikers zijn de voordelen zelfs nog groter, aangezien de efficiëntiewinsten lagere kosten voor het genereren van goede antwoorden met zich meebrengen.
Het Allen Institute heeft een geheel nieuwe dataset, Dolma 3, gebouwd met 5.9 triljoen tokens, en biedt daarbij volledige broncode en trainingsrecepten aan. Drie modelvarianten, te weten Base, Think en Instruct, met respectievelijk 7 en 32 miljard parameters zijn beschikbaar. “Echte openheid in AI is niet alleen een kwestie van toegang, maar gaat ook over vertrouwen, verantwoordelijkheid en gedeelde vooruitgang,” aldus het instituut. Olmo 3-Think 32B is het eerste volledig open-reasoning model van deze schaal, getraind op slechts een zesde van de tokens van vergelijkbare modellen, maar dat toch competitieve prestaties levert.
Deep Cognito heeft in augustus 13 miljoen dollar aan seed funding opgehaald, geleid door Benchmark. Het plan is om geavanceerdere modellen te ontwikkelen die gebruikmaken van aanzienlijk meer rekenkracht met betere datasets. Tegelijkertijd heeft Nvidia het ontwikkelingsproces van Olmo 3 ondersteund. Vice-president Kari Briski noemde het essentieel voor “ontwikkelaars om AI op te schalen met open, Amerikaanse modellen.”
Wat zijn de belangrijkste verschillen tussen de modellen van Deep Cognito en het Allen Institute?
Deep Cognito concentreert zich op snelle iteratie gebaseerd op een fork van een Chinees model, terwijl het Allen Institute inzet op volledige transparantie door alles zelf te ontwikkelen, van training tot implementatie.
Waarom zijn open-source modellen zo cruciaal voor de toekomst van AI?
Open-source modellen bieden toegang en controle over de basisstructuren waarop bedrijven hun producten bouwen, wat van groot belang is voor technologische onafhankelijkheid en innovatie.
Wat kunnen investeerders verwachten van deze ontwikkelingen in de Amerikaanse AI-markt?
Investeringen in open-source AI kunnen een strategische kans zijn, vooral als bedrijven hun afhankelijkheid van buitenlandse technologie kunnen verminderen en in eigen land een leiderschapspositie kunnen opbouwen.
