ElevenLabs amplía su acuerdo con Google Cloud con GPUs NVIDIA Blackwell

Por GenMediaLab • 2 de marzo de 2026 • 5 min de lectura

ElevenLabs ha firmado una prórroga plurianual de su alianza con Google Cloud, obteniendo acceso a máquinas virtuales G4 equipadas con GPUs NVIDIA RTX PRO 6000 Blackwell. El acuerdo también integra los modelos Gemini de Google en la plataforma de agentes de ElevenLabs y Veo en su plataforma creativa para la producción sincronizada de vídeo y audio.

Puntos Clave

✓ La ampliación plurianual con Google Cloud incorpora GPUs NVIDIA Blackwell para un entrenamiento e inferencia de modelos de voz más rápidos
✓ Los modelos Gemini impulsan ahora el razonamiento y la planificación multietapa dentro de los agentes de voz de ElevenLabs
✓ La integración de Veo permite a los equipos producir contenido de vídeo y audio sincronizado desde un único flujo de trabajo
✓ Las soluciones de ElevenLabs están disponibles en Google Cloud Marketplace con soporte para créditos de compromiso GCP
✓ Los clientes empresariales obtienen inferencia más rápida, menor latencia y agentes de voz en tiempo real en más de 70 idiomas

Prueba la voz IA de ElevenLabs

Crea agentes de voz, genera habla en más de 70 idiomas y accede a la plataforma completa de ElevenLabs.

Probar ElevenLabs gratis →

Qué incluye la alianza

La colaboración ampliada abarca tres áreas principales: infraestructura, integración de modelos y distribución empresarial.

70+ Idiomas soportados

G4 VMs GPUs NVIDIA Blackwell

4.7/5 Valoración GenMediaLab

Plurianual Duración de la alianza

Infraestructura: ElevenLabs ejecutará sus modelos de voz en máquinas virtuales G4 de Google Cloud equipadas con GPUs NVIDIA RTX PRO 6000 Blackwell. Estas VMs ofrecen hasta 96 GB de memoria por GPU, hasta 768 GB total de memoria GDDR7 y hasta 9 veces más rendimiento que las instancias G2 de la generación anterior. El clúster de GPUs más grande permite ciclos de entrenamiento más rápidos e inferencia de menor latencia para despliegues empresariales.

Integración de modelos: Los modelos Gemini de Google se integran en la plataforma de agentes de ElevenLabs para razonamiento avanzado y planificación multietapa en asistentes de voz. Por separado, el modelo de generación de vídeo Veo de Google se añade a la plataforma creativa de ElevenLabs, permitiendo a los equipos producir contenido de vídeo y audio de forma conjunta.

Distribución empresarial: Las soluciones de ElevenLabs ya están disponibles en Google Cloud Marketplace, lo que permite a las empresas comprar e implementar herramientas de voz IA con facturación y cumplimiento normativo simplificados. Los créditos de compromiso GCP existentes pueden aplicarse a los servicios de ElevenLabs.

NVIDIA Blackwell: qué significa para la voz IA

Las VMs G4 representan una mejora de hardware significativa para la infraestructura de ElevenLabs. Las GPUs NVIDIA Blackwell incluyen núcleos Tensor y RT de cuarta generación, diseñados específicamente para cargas de trabajo de IA.

Inferencia más rápida

Hasta 9 veces más rendimiento que las instancias G2 para generación de voz con menor latencia

Entrenamiento de modelos más grandes

768 GB de memoria GDDR7 permiten entrenar modelos multimodales más grandes

Escalado flexible

Configuraciones de 1 a 8 GPUs con particionamiento MIG para aislamiento de cargas de trabajo

Alcance global

La infraestructura de Google Cloud ofrece rendimiento consistente en todas las regiones

Mati Staniszewski, cofundador de ElevenLabs, afirmó que la mejora de hardware impacta directamente en la calidad del producto: “Ahora, con las VMs G4 impulsadas por NVIDIA Blackwell, estamos llevando nuestros modelos multimodales aún más lejos: inferencia más rápida, mayor fiabilidad, respuestas instantáneas en todos los idiomas. El objetivo sigue siendo el mismo: crear agentes de voz que funcionen a escala empresarial sin compromisos.”

Ian Buck, vicepresidente y director general de Hyperscale y HPC en NVIDIA, añadió: “Este es exactamente el tipo de innovación ecosistémica que imaginamos con Blackwell: ayudar a pioneros como ElevenLabs a llevar agentes de IA y herramientas de medios más inteligentes y receptivos a todas las industrias.”

Gemini impulsa los agentes de voz de ElevenLabs

La integración en la plataforma de agentes incorpora las capacidades de razonamiento de Gemini a los asistentes de voz de ElevenLabs. Gemini gestiona la capa de “pensamiento” -comprender el contexto, planificar respuestas multietapa y llamar a funciones- mientras ElevenLabs gestiona la capa de voz con síntesis de voz de baja latencia.

Esta combinación se dirige a casos de uso empresariales donde los agentes de voz deben manejar conversaciones complejas: atención al cliente con múltiples sistemas, llamadas comerciales que extraen datos de productos y simulaciones de formación que se adaptan a las respuestas del alumno.

Cómo funciona

Gemini proporciona razonamiento ultrarrápido y llamadas a funciones como cerebro de IA detrás de los agentes de voz. ElevenLabs ofrece la salida de voz con sonido humano. Juntos crean IA conversacional que puede entender la intención, recuperar información y responder de forma natural en tiempo real.

Integración de Veo: el vídeo se encuentra con la voz

La integración en la plataforma creativa incorpora el modelo de generación de vídeo Veo de Google junto con las herramientas de audio de ElevenLabs. Los equipos pueden generar contenido de vídeo y añadir locuciones, efectos de sonido y narración dentro de un único flujo de producción.

Los casos de uso incluyen publicidad, formación corporativa, comunicaciones internas y formación de clientes: escenarios en los que las organizaciones necesitan tanto vídeo profesional como contenido de voz a escala.

Matt Renner, presidente y director de ingresos de Google Cloud, enmarcó la alianza en términos empresariales: “Al aprovechar la pila completa de IA de Google Cloud, incluidos nuestros modelos de IA líderes y las plataformas de computación acelerada de vanguardia de NVIDIA, ElevenLabs está haciendo posible que las empresas transformen la forma en que interactúan con los usuarios.”

Disponibilidad en Google Cloud Marketplace

Las soluciones de síntesis de voz, IA conversacional y doblaje de ElevenLabs están disponibles directamente a través de Google Cloud Marketplace. Esto es relevante para la adquisición empresarial porque implica:

Facturación simplificada a través de las cuentas existentes de Google Cloud
Créditos de compromiso GCP aplicables a los servicios de ElevenLabs
Alineación de cumplimiento con las certificaciones de seguridad de Google Cloud
Despliegue más rápido sin incorporación de proveedores por separado

Dai Vu, director gerente de Marketplace y programas ISV GTM en Google Cloud, señaló: “Incorporar la solución de ElevenLabs a Google Cloud Marketplace ayudará a los clientes a desplegar, gestionar y ampliar rápidamente la síntesis de voz, el doblaje y la IA conversacional en la infraestructura global y de confianza de Google Cloud.”

Qué implica esto

Esta alianza refleja una tendencia más amplia en la IA: la tecnología de voz está pasando de APIs independientes a infraestructura empresarial profundamente integrada. ElevenLabs ya no es solo un proveedor de síntesis de voz: tras iniciativas como Scribe v2 para conversión de voz a texto y el Marketplace de voces icónicas, se posiciona como una plataforma completa de voz IA respaldada por computación de hiperescala.

Para creadores y empresas que evalúan herramientas de voz IA, las implicaciones prácticas son:

Menor latencia para aplicaciones en tiempo real como doblaje en vivo y agentes de voz
Mejor calidad de modelos gracias al entrenamiento en hardware más potente
Adquisición más sencilla para organizaciones que ya usan Google Cloud
Flujos de trabajo multimodales que combinan vídeo Veo con audio de ElevenLabs

La integración de Gemini es especialmente significativa. Los agentes de voz que pueden razonar sobre solicitudes complejas y extraer datos de múltiples sistemas representan la siguiente fase de la IA conversacional más allá de los chatbots de preguntas y respuestas simples.

Crea agentes de voz con ElevenLabs

Accede a síntesis de voz, clonación de voz, IA conversacional y doblaje en más de 70 idiomas en una sola plataforma.

Empezar con ElevenLabs →

Preguntas Frecuentes

¿Para qué se usan las GPUs NVIDIA Blackwell en esta alianza?

ElevenLabs utiliza las GPUs NVIDIA RTX PRO 6000 Blackwell a través de las máquinas virtuales G4 de Google Cloud para entrenar y servir sus modelos de voz IA. Estas GPUs ofrecen hasta 9 veces más rendimiento que las instancias de la generación anterior, lo que resulta en inferencia más rápida, menor latencia y soporte para entrenar modelos multimodales más grandes.

¿Cómo se integra Gemini con ElevenLabs?

Los modelos Gemini de Google se integran en la plataforma de agentes de ElevenLabs para gestionar el razonamiento y la planificación multietapa de los asistentes de voz. Gemini actúa como el cerebro de IA que comprende el contexto y llama a funciones, mientras ElevenLabs proporciona la salida de voz con sonido humano para la conversación.

¿Puedo usar créditos GCP para los servicios de ElevenLabs?

Sí, los clientes empresariales con créditos de compromiso existentes de Google Cloud Platform pueden aplicarlos a los servicios de voz IA de ElevenLabs adquiridos a través de Google Cloud Marketplace. Esto incluye síntesis de voz, IA conversacional y soluciones de doblaje.

¿Para qué sirve la integración de Veo?

El modelo de generación de vídeo Veo de Google se integra en la plataforma creativa de ElevenLabs, permitiendo a los equipos producir contenido de vídeo y audio dentro de un único flujo de trabajo. Se dirige a casos de uso como publicidad, formación corporativa y formación de clientes, donde las organizaciones necesitan contenido de vídeo y voz sincronizado.

¿Cuántos idiomas soporta ElevenLabs?

ElevenLabs soporta la creación y localización de contenido en más de 70 idiomas. La alianza ampliada con Google Cloud proporciona la infraestructura para ofrecer agentes de voz en tiempo real y síntesis de voz en todos los idiomas soportados con latencia baja y consistente.

Fuentes

¿Te resultó útil este artículo?

Última actualización: 2 de marzo de 2026

Divulgación de afiliados: Esta reseña contiene enlaces de afiliados. Si compras a través de nuestros enlaces, podemos ganar una comisión sin costo adicional para ti. Solo recomendamos herramientas que hemos probado personalmente y creemos que brindan un valor genuino a nuestros lectores.