Parler à quelqu'un à l'autre bout du monde sans que la langue ne soit un obstacle. Un rêve ? Peut-être plus pour très longtemps. Google, lors de sa grande conférence I/O, a levé le voile sur une avancée pour son service Google Meet qui pourrait bien changer la donne. Il s'agit d'une fonction de traduction vocale en temps réel. Sa particularité ? Elle est propulsée par l'intelligence artificielle Gemini et promet des conversations étonnamment naturelles, même entre interlocuteurs ne partageant pas la même langue.

Une traduction IA qui conserve votre "couleur" vocale

Imaginez la scène. Vous êtes en visioconférence avec un collègue ou un proche qui parle une autre langue. Vous parlez normalement. Et presque instantanément, votre interlocuteur entend vos propos traduits... mais avec votre propre voix, votre ton, vos intonations. C'est la prouesse que Google s'apprête à offrir dans Meet. Yulie Kwon Kim, une des responsables de Google Workspace, l'a bien résumé : "Pensez à un interprète simultané... puis passez au niveau supérieur, où l'interprète n'est pas la voix d'une autre personne, mais la propre voix de l'orateur." Techniquement, lorsqu'un utilisateur active cette fonction, un modèle d'IA audio de Google DeepMind analyse la parole. Gemini se charge ensuite de la traduire. Pour l'auditeur, la voix originale du locuteur reste perceptible, mais en sourdine. La traduction, elle, est claire, au premier plan, et cherche à reproduire les nuances de l'expression initiale. Google promet une latence très faible. De quoi permettre des discussions fluides, même à plusieurs.

L'IA au service de connexions humaines plus authentiques

Cette nouvelle fonctionnalité repose sur les dernières avancées de Google en matière d'IA et de traitement audio. L'objectif est ambitieux. Il s'agit de rendre les échanges internationaux bien plus naturels qu'une simple transcription de mots. Le but est de préserver une part de l'authenticité humaine de la conversation. Les applications sont vastes. Cela va des échanges familiaux entre générations parlant des langues différentes, comme des petits-enfants anglophones discutant avec leurs grands-parents hispanophones, jusqu'aux réunions professionnelles dans des entreprises multinationales. Les collègues de différents pays pourront ainsi collaborer plus facilement et de manière plus spontanée. La technologie est pensée pour être un facilitateur discret, au service direct de la compréhension mutuelle. Si Microsoft Teams a récemment exploré des pistes similaires, l'approche de Google sur la préservation de la voix est particulièrement notable.

Disponibilité : qui peut déjà tester cette traduction du futur ?

Quand pourra-t-on tester cette petite merveille ? Le déploiement de la traduction vocale dans Google Meet a débuté en version bêta. Elle est accessible dès maintenant pour les utilisateurs abonnés aux offres "AI Premium" de Google (Google AI Pro ou le nouveau plan AI Ultra). Pour commencer, la traduction fonctionnera entre l'anglais et l'espagnol. Mais Google a déjà annoncé l'arrivée prochaine d'autres langues. L'italien, l'allemand et le portugais devraient suivre dans les semaines à venir. Les clients professionnels utilisant Google Workspace devront faire preuve d'un peu plus de patience. Des tests sont prévus pour eux plus tard cette année. Cette intégration de Gemini dans les outils du quotidien illustre parfaitement la stratégie de Google. Le géant américain veut infuser son intelligence artificielle partout, pour des usages concrets qui simplifient la vie et la communication.