Stepfun's Stepaudio 2.5: een revolutie in stem-AI

Stepfun Lanceert Stepaudio 2.5: Nieuwe Standaard In Realtime Spraakherkenning En Ai-persona’s

27 mei 2026 om 12:24

Leestijd: 2 minuten

De lancering van StepAudio 2.5 Realtime door het Shanghai-gebaseerde AI-lab StepFun markeert een significante vooruitgang in de real-time spraakherkenning. Dit eind-tot-eind model maakt het mogelijk om audio in te voeren en direct audio uit te geven, zonder de noodzaak voor tekstconversie. De ondersteuning voor zowel het Chinees als het Engels geeft het model een aanzienlijk bereik. De eerste benchmarks wijzen op indrukwekkende prestaties, wat vragen oproept over de impact op de bredere markt voor spraak-AI, en daarmee ook voor investeerders.

Een veelvoorkomend probleem binnen AI-persoonlijkheidssystemen is dat ze in bepaalde situaties, vaak onder druk, uit hun rol gaan. Dit fenomeen, gekend als OOC (out-of-character), kan gebruikerservaringen sterk beïnvloeden en ondermijnt het vertrouwen in dergelijke systemen. Veel AI-modellen vertonen deze kwetsbaarheid door informatie te vergeten of inconsistent te reageren naarmate de interactie vordert.

StepFun beweert dit probleem te hebben aangepakt met behulp van specifieke RLHF (reinforcement learning from human feedback), gericht op de stabiliteit van de persona. De trainingsdata, die begint met meer dan 10.000 handmatig geschreven persona-zaadjes, is algoritmisch uitgebreid tot een featurematrix van miljoenenschaal. De gedachte erachter is om voldoende variëteit te bieden in de trainingsdata, zodat zelfs in lange en complexe gesprekken de karakterintegriteit behouden blijft.

Een bijzonder aspect van StepAudio is de paralinguïstische begrip, waarbij het model niet alleen de gesproken woorden analyseert, maar ook de niet-verbale akoestische signalen zoals spreektempo, emotionele toon en zelfs de leeftijd van de spreker. Deze innovatieve benadering zorgt voor een dieper begrip tijdens interacties, wat essentieel kan zijn voor een authentieke gebruikerservaring. Op de benchmark voor paralinguïstisch begrip scoorde StepAudio 82.18, wat aanzienlijk beter is dan zijn concurrenten, zoals GPT Realtime 1.5 en Gemini Live. Dit biedt niet alleen een technologische voorsprong, maar toont ook de mogelijkheden voor investeerders om te profiteren van een snelgroeiende sector.

Opgericht in april 2023 door Jiang Daxin, die 16 jaar bij Microsoft werkte aan innovatieve projecten zoals Bing en Cortana, staat StepFun symbool voor de opkomende AI-startups in China, ook wel bekend als de ‘AI Tigers’. Met een geraamde financiering van ongeveer 1,7 miljard dollar, wordt StepFun nu geconfronteerd met de benchmarks van OpenAI, die in 2024 zijn spraakmodellen lanceerde. Het bedrijf heeft ambitieuze plannen en beweert directe overwinningen in zijn vergelijkingen.

Het aanbod omvat de AI-persona Xiao Yue, die gebruikers moet doen voelen alsof ze met een vriend communiceren in plaats van met een softwaretool. Deze benadering, die configuraties mogelijk maakt van meningen tot emotionele grenzen, biedt ontwikkelaars de vrijheid om hun eigen unieke persona’s te creëren via de API van StepFun. Dit opent de deur naar een diversiteit aan toepassingen die niet alleen relevant zijn voor de technologie, maar ook voor de investeringsstrategieën in de toekomst.

Vraag & Antwoord

Hoe onderscheidt StepAudio zich van andere spraakmodellen?
StepAudio onderscheidt zich door zijn geïntegreerde paralinguïstische begrip, wat het model in staat stelt om emotionele en akoestische signalen te interpreteren en daardoor meer natuurlijke en contextuele reacties te geven.

Wat betekent de ontwikkeling van StepAudio voor investeerders?
De ontwikkelingen in StepAudio wijzen op een toenemende vraag naar geavanceerde spraak-AI-technologieën, wat kan resulteren in nieuwe investeringskansen binnen de snelgroeiende sector van kunstmatige intelligentie.

Hoe heeft StepFun het probleem van OOC opgelost?
StepFun heeft het probleem van OOC aangepakt door specifieke RLHF-technieken te implementeren die gericht zijn op het behouden van persona-stabiliteit, wat leidt tot meer consistente en betrouwbare interacties met gebruikers.

Deel dit Artikel:

Disclaimer: de informatie op Block 9 is uitsluitend bedoeld voor algemene informatieve en educatieve doeleinden. Hoewel wij streven naar het aanbieden van actuele, correcte en relevante content, geven wij geen garanties met betrekking tot de volledigheid, juistheid of betrouwbaarheid van de verstrekte informatie. Alle inhoud op deze website, waaronder artikelen, analyses, meningen en andere publicaties, is bedoeld als algemene informatie en vormt op geen enkele wijze professioneel of juridisch advies, inclusief maar niet beperkt tot financieel, beleggings- of belastingadvies.

Block 9 geeft geen enkele garantie en doet geen enkele toezegging over mogelijke resultaten of opbrengsten die kunnen voortvloeien uit het gebruik van informatie op deze website. Niets op deze website mag worden geïnterpreteerd als een aanbeveling tot aankoop, verkoop of het aanhouden van bepaalde activa, waaronder maar niet beperkt tot cryptovaluta, tokens of andere financiële instrumenten.

De meningen en standpunten die worden geuit in bijdragen van redacteuren, externe auteurs of communityleden zijn strikt persoonlijk en vertegenwoordigen niet noodzakelijkerwijs de zienswijze of het beleid van Block 9 als platform. Block 9 aanvaardt geen enkele aansprakelijkheid voor enig verlies of schade – direct of indirect – als gevolg van het gebruik van (of het vertrouwen op) de informatie die op deze website wordt gepubliceerd.

Beleggen in cryptovaluta en andere digitale activa brengt aanzienlijke risico’s met zich mee. De waarde van dergelijke activa kan sterk fluctueren, en er bestaat een kans dat je (een deel van) je inleg verliest. Wij raden je ten zeerste aan om altijd je eigen onderzoek te doen (do your own research – DYOR) en onafhankelijk advies in te winnen van een gekwalificeerde financieel adviseur voordat je financiële beslissingen neemt. Door deze website te gebruiken, ga je akkoord met deze disclaimer en accepteer je dat Block 9 niet verantwoordelijk is voor jouw investeringskeuzes of de resultaten daarvan.

Crypto Nieuws

Navigeren Door De Evolutie: De Toekomst Van Crypto-regulering In Europa

Block #9

Starters Trekken Zich Terug: Koopbereidheid Daalt Ondanks Recordaanbod Woningen

Crypto Nieuws

Poolin Technology Vraagt Chapter 11 Bescherming Aan: Een Blik Op De Nasleep Van Mijnbouwactiviteiten En Iou’s

Crypto Opslag

Block #9

Stepfun Lanceert Stepaudio 2.5: Nieuwe Standaard In Realtime Spraakherkenning En Ai-persona’s

Vraag & Antwoord

Coindesk 20 Index: De Implicaties Van Marktfluctuaties Voor Crypto-investeerders

Bitmine Verwerft $237m In Ethereum: Impact Op Aandelen En Invloed Op Crypto Markt

Slimme insiders lezen mee – jij ook?

Connect met Block #9

block9news

@block9news

@block9news

Niet Te Missen:

Navigeren Door De Evolutie: De Toekomst Van Crypto-regulering In Europa

Starters Trekken Zich Terug: Koopbereidheid Daalt Ondanks Recordaanbod Woningen

Poolin Technology Vraagt Chapter 11 Bescherming Aan: Een Blik Op De Nasleep Van Mijnbouwactiviteiten En Iou’s

Samsung Wallet Voegt Ondersteuning Voor Stablecoins Toe: Een Nieuwe Stap Voor Crypto-gebruik In Mainstream Tech