Gradium, une jeune pousse issue du laboratoire d'IA Kyutai, sort de l'ombre avec un financement d'amorçage massif de 60 millions d'euros. Portée par des anciens de Meta et Google DeepMind, et soutenue par des figures comme Xavier Niel, Rodolphe Saadé et Eric Schmidt, l'entreprise affiche une ambition claire : s'imposer comme la référence mondiale des technologies vocales.

D'où vient Gradium et qui sont ses investisseurs ?

Gradium n'est pas une startup sortie de nulle part. C'est le premier spin-off officiel de Kyutai, le laboratoire de recherche en IA à but non-lucratif lancé en grande pompe en 2023. À sa tête, on retrouve un quatuor d'experts : Neil Zeghidour (CEO), Olivier Teboul (CTO), Alexandre Défossez (Directeur scientifique) et Laurent Mazaré, tous passés par les laboratoires les plus en pointe comme Meta FAIR ou Google DeepMind. Cette filiation explique la confiance des investisseurs.

Le tour de table de 60 millions d'euros est mené par des fonds de premier plan comme FirstMark Capital et Eurazeo, avec la participation des parrains de Kyutai. Pour Neil Zeghidour, il ne s'agit pas d'un "divorce" mais d'une suite logique : capitaliser sur une opportunité commerciale immense que la structure non-lucrative de Kyutai ne pouvait adresser. Le potentiel de l'IA vocale est jugé colossal, et Gradium a été créé pour le saisir.

Quelle est la technologie qui la rend si prometteuse ?

L'avantage compétitif de Gradium repose sur une approche technologique de rupture. Oubliez les assistants vocaux actuels, souvent lents et robotiques. La startup développe des modèles de langage audio (ALM) basés sur une architecture "speech-to-speech". Concrètement, le modèle génère une réponse vocale directement à partir d'une entrée vocale, sans passer par une étape de transcription textuelle.

Gradium

Cette innovation permet d'atteindre une très faible latence, rendant la conversation quasi instantanée et naturelle. Il devient même possible d'interrompre l'IA comme on le ferait avec un humain. Déjà fonctionnelle en plusieurs langues (français, anglais, allemand, espagnol, portugais), cette technologie a rapidement séduit des premiers clients dans des secteurs exigeants comme le gaming pour les PNJ (personnages non-joueurs) et le support client.

Quelles sont ses ambitions face aux géants américains ?

Avec seulement neuf collaborateurs, Gradium mise sur l'agilité et l'excellence de son équipe pour rivaliser avec la Silicon Valley. L'objectif n'est pas d'être choisi pour son ADN français, mais pour la supériorité de son produit, à l'image d'un Spotify. La startup veut fournir les briques technologiques qui permettront de faire de l'interaction vocale l'interface par défaut entre les humains et les machines.

Gradium 02

Gradium veut devenir le leader incontesté de toutes les technologies vocales. La traction est déjà là, avec des premiers clients signés en seulement six semaines. En s'appuyant sur les travaux open source de Kyutai comme les modèles Moshi ou Hibiki, l'entreprise se positionne pour que ses modèles "soient utilisés des milliards de fois". Une ambition qui rappelle celle d'un autre champion français de l'IA, Mistral, et qui confirme que Paris est bien devenue une place forte de l'innovation technologique mondiale.

Foire Aux Questions (FAQ)

Qu'est-ce que Gradium ?

Gradium est une startup française spécialisée dans l'intelligence artificielle vocale. Issue du laboratoire de recherche Kyutai, elle développe des modèles de langage audio pour créer des interactions vocales ultra-réalistes et à très faible latence entre les humains et les machines.

Combien Gradium a-t-elle levé et auprès de qui ?

Gradium a annoncé une levée de fonds d'amorçage de 60 millions d'euros. Le financement a été mené par FirstMark Capital et Eurazeo, avec la participation d'investisseurs de renom comme Xavier Niel, Rodolphe Saadé et Eric Schmidt.

Quelle est l'innovation majeure de Gradium ?

L'innovation principale de Gradium est sa technologie "speech-to-speech". Elle permet de générer une réponse vocale directement depuis une requête orale, sans transcription écrite intermédiaire. Cela réduit drastiquement la latence et rend la conversation plus fluide et naturelle.