ElevenLabs renforce son partenariat Google Cloud avec les GPU NVIDIA Blackwell

Par GenMediaLab • 2 mars 2026 • 5 min de lecture

ElevenLabs a signé une prolongation pluriannuelle de son partenariat avec Google Cloud, obtenant l’accès aux machines virtuelles G4 équipées des GPU NVIDIA RTX PRO 6000 Blackwell. L’accord intègre également les modèles Gemini de Google dans la plateforme Agents d’ElevenLabs et Veo dans sa plateforme Creative pour la production vidéo et audio synchronisées.

Points Clés

✓ La prolongation pluriannuelle avec Google Cloud apporte les GPU NVIDIA Blackwell pour un entraînement et une inférence vocale plus rapides
✓ Les modèles Gemini alimentent désormais le raisonnement et la planification multi-étapes des agents vocaux ElevenLabs
✓ L'intégration de Veo permet aux équipes de produire du contenu vidéo et audio synchronisé dans un seul flux de travail
✓ Les solutions ElevenLabs sont désormais disponibles sur Google Cloud Marketplace avec prise en charge des crédits d'engagement GCP
✓ Les clients entreprises bénéficient d'une inférence plus rapide, d'une latence réduite et d'agents vocaux en temps réel dans plus de 70 langues

Essayez la voix IA ElevenLabs

Créez des agents vocaux, générez de la parole dans plus de 70 langues et accédez à la plateforme ElevenLabs complète.

Essayer ElevenLabs gratuitement →

Contenu du partenariat

La collaboration élargie couvre trois domaines clés : l’infrastructure, l’intégration des modèles et la distribution entreprise.

70+ Langues supportées

VM G4 GPU NVIDIA Blackwell

4.7/5 Note GenMediaLab

Pluriannuel Durée du partenariat

Infrastructure : ElevenLabs exécutera ses modèles vocaux sur les machines virtuelles G4 de Google Cloud équipées des GPU NVIDIA RTX PRO 6000 Blackwell. Ces VM offrent jusqu’à 96 Go de mémoire par GPU, jusqu’à 768 Go de mémoire GDDR7 au total et jusqu’à 9 fois le débit par rapport aux instances G2 de la génération précédente. Le cluster GPU plus important permet des cycles d’entraînement plus rapides et une inférence à latence réduite pour les déploiements entreprise.

Intégration des modèles : Les modèles Gemini de Google sont intégrés à la plateforme Agents d’ElevenLabs pour le raisonnement avancé et la planification multi-étapes des assistants vocaux. Parallèlement, le modèle de génération vidéo Veo de Google est ajouté à la plateforme Creative d’ElevenLabs, permettant aux équipes de produire ensemble du contenu vidéo et audio.

Distribution entreprise : Les solutions ElevenLabs sont désormais référencées sur Google Cloud Marketplace, permettant aux entreprises d’acheter et de déployer des outils de voix IA avec une facturation et une conformité simplifiées. Les crédits d’engagement GCP existants peuvent être appliqués aux services ElevenLabs.

NVIDIA Blackwell : impact pour la voix IA

Les VM G4 représentent une mise à niveau matérielle significative pour l’infrastructure d’ElevenLabs. Les GPU NVIDIA Blackwell intègrent des Tensor Cores et RT cores de quatrième génération, conçus pour les charges de travail IA.

Inférence plus rapide

Jusqu'à 9 fois le débit par rapport aux instances G2 pour une génération vocale à latence réduite

Entraînement de modèles plus grands

768 Go de mémoire GDDR7 permettent d'entraîner des modèles multimodaux plus volumineux

Mise à l'échelle flexible

Configurations de 1 à 8 GPU avec partitionnement MIG pour l'isolation des charges de travail

Portée mondiale

L'infrastructure Google Cloud assure des performances constantes dans toutes les régions

Mati Staniszewski, cofondateur d’ElevenLabs, souligne que la mise à niveau matérielle impacte directement la qualité des produits : « Avec les VM G4 alimentées par NVIDIA Blackwell, nous poussons nos modèles multimodaux encore plus loin : inférence plus rapide, meilleure fiabilité, réponses instantanées dans toutes les langues. L’objectif reste le même : créer des agents vocaux qui fonctionnent à l’échelle entreprise sans compromis. »

Ian Buck, vice-président et directeur général Hyperscale et HPC chez NVIDIA, ajoute : « C’est exactement le type d’innovation d’écosystème que nous envisagions avec Blackwell : aider des pionniers comme ElevenLabs à proposer des agents IA et des outils média plus intelligents et réactifs à tous les secteurs. »

Gemini au cœur des agents vocaux ElevenLabs

L’intégration à la plateforme Agents apporte les capacités de raisonnement de Gemini aux assistants vocaux ElevenLabs. Gemini gère la couche « pensée » - compréhension du contexte, planification des réponses multi-étapes et appels de fonctions - tandis qu’ElevenLabs gère la couche vocale avec une synthèse vocale à faible latence.

Cette combinaison cible les cas d’usage entreprise où les agents vocaux doivent gérer des conversations complexes : support client avec plusieurs systèmes, appels commerciaux exploitant des données produits, et simulations de formation qui s’adaptent aux réponses des apprenants.

Fonctionnement

Gemini fournit un raisonnement ultra-rapide et des appels de fonctions comme cerveau IA derrière les agents vocaux. ElevenLabs assure la sortie vocale naturelle. Ensemble, ils créent une IA conversationnelle capable de comprendre l’intention, récupérer des informations et répondre naturellement en temps réel.

Intégration Veo : vidéo et voix réunies

L’intégration à la plateforme Creative associe le modèle de génération vidéo Veo de Google aux outils audio d’ElevenLabs. Les équipes peuvent générer du contenu vidéo et ajouter des voix off, effets sonores et narrations dans un seul flux de production.

Les cas d’usage ciblés incluent la publicité, la formation corporate, la communication interne et la formation client - des scénarios où les organisations ont besoin à la fois de vidéo et de contenu vocal professionnels à grande échelle.

Matt Renner, président et directeur des revenus chez Google Cloud, présente le partenariat en termes entreprise : « En s’appuyant sur la pile IA complète de Google Cloud, y compris nos modèles IA leaders, ainsi que sur les plateformes de calcul accéléré de pointe de NVIDIA, ElevenLabs permet aux entreprises de transformer leur façon d’interagir avec les utilisateurs. »

Disponibilité sur Google Cloud Marketplace

Les solutions de synthèse vocale, d’IA conversationnelle et de doublage d’ElevenLabs sont désormais disponibles directement via Google Cloud Marketplace. Cela compte pour les achats entreprise car cela signifie :

Facturation simplifiée via les comptes Google Cloud existants
Crédits d’engagement GCP applicables aux services ElevenLabs
Alignement de conformité avec les certifications de sécurité Google Cloud
Déploiement plus rapide sans onboarding fournisseur séparé

Dai Vu, directeur général Marketplace et programmes ISV GTM chez Google Cloud, précise : « L’intégration de la solution ElevenLabs sur Google Cloud Marketplace aidera les clients à déployer, gérer et développer rapidement la synthèse vocale, le doublage et l’IA conversationnelle sur l’infrastructure mondiale et fiable de Google Cloud. »

Ce que cela implique

Ce partenariat reflète une tendance plus large dans l’IA : la technologie vocale passe d’API autonomes à une infrastructure entreprise profondément intégrée. ElevenLabs n’est plus seulement un fournisseur de synthèse vocale - après des initiatives comme Scribe v2 pour la transcription et le Marketplace de voix emblématiques, il se positionne comme une plateforme voix IA complète soutenue par le calcul hyperscaler.

Pour les créateurs et entreprises qui évaluent les outils de voix IA, les implications pratiques sont :

Latence réduite pour les applications temps réel comme le doublage en direct et les agents vocaux
Meilleure qualité des modèles grâce à l’entraînement sur du matériel plus puissant
Achats simplifiés pour les organisations déjà sur Google Cloud
Flux de travail multimodaux combinant la vidéo Veo et l’audio ElevenLabs

L’intégration Gemini est particulièrement significative. Les agents vocaux capables de raisonner sur des demandes complexes et d’extraire des données de plusieurs systèmes représentent la prochaine phase de l’IA conversationnelle au-delà des chatbots simples en questions-réponses.

Créez des agents vocaux avec ElevenLabs

Accédez à la synthèse vocale, au clonage vocal, à l'IA conversationnelle et au doublage dans plus de 70 langues sur une seule plateforme.

Commencer avec ElevenLabs →

Questions fréquentes

À quoi servent les GPU NVIDIA Blackwell dans ce partenariat ?

ElevenLabs utilise les GPU NVIDIA RTX PRO 6000 Blackwell via les machines virtuelles G4 de Google Cloud pour entraîner et servir ses modèles de voix IA. Ces GPU offrent jusqu'à 9 fois le débit par rapport aux instances de la génération précédente, entraînant une inférence plus rapide, une latence réduite et le support de l'entraînement de modèles multimodaux plus volumineux.

Comment Gemini s'intègre-t-il à ElevenLabs ?

Les modèles Gemini de Google sont intégrés à la plateforme Agents d'ElevenLabs pour gérer le raisonnement et la planification multi-étapes des assistants vocaux. Gemini agit comme le cerveau IA qui comprend le contexte et appelle des fonctions, tandis qu'ElevenLabs fournit la sortie vocale naturelle pour la conversation.

Puis-je utiliser des crédits GCP pour les services ElevenLabs ?

Oui, les clients entreprises disposant de crédits d'engagement Google Cloud Platform existants peuvent les appliquer aux services voix IA ElevenLabs achetés via Google Cloud Marketplace. Cela inclut la synthèse vocale, l'IA conversationnelle et les solutions de doublage.

À quoi sert l'intégration Veo ?

Le modèle de génération vidéo Veo de Google est intégré à la plateforme Creative d'ElevenLabs, permettant aux équipes de produire à la fois du contenu vidéo et audio dans un seul flux de travail. Cela cible des cas d'usage comme la publicité, la formation corporate et la formation client, où les organisations ont besoin de contenu vidéo et vocal synchronisé.

Combien de langues ElevenLabs supporte-t-il ?

ElevenLabs prend en charge la création et la localisation de contenu dans plus de 70 langues. Le partenariat élargi avec Google Cloud fournit l'infrastructure pour délivrer des agents vocaux en temps réel et une synthèse vocale dans toutes les langues supportées avec une faible latence constante.

Sources

Cet article vous a-t-il été utile ?

Dernière mise à jour: 2 mars 2026

Divulgation d'affiliation : Cet avis contient des liens d'affiliation. Si vous achetez via nos liens, nous pouvons recevoir une commission sans frais supplémentaires pour vous. Nous recommandons uniquement les outils que nous avons personnellement testés et qui, selon nous, apportent une réelle valeur à nos lecteurs.