ElevenLabs + Google Cloud + NVIDIA

Darius Z. Por Darius Z. 5 min de leitura
Fones de estúdio em mesa com monitores de forma de onda de áudio para a parceria de voz IA ElevenLabs Google Cloud

A ElevenLabs assinou uma extensão plurianual da sua parceria com o Google Cloud, ganhando acesso a máquinas virtuais G4 equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell. O acordo também integra os modelos Gemini da Google na Plataforma de Agentes da ElevenLabs e o Veo na sua Plataforma Criativa para produção sincronizada de vídeo e áudio.

Pontos Principais

  • Extensão plurianual com Google Cloud traz GPUs NVIDIA Blackwell para treinamento e inferência de modelos de voz mais rápidos
  • Modelos Gemini agora alimentam raciocínio e planejamento multi-etapas nos agentes de voz ElevenLabs
  • Integração Veo permite que equipes produzam conteúdo de vídeo e áudio sincronizados em um único fluxo de trabalho
  • Soluções ElevenLabs agora disponíveis no Google Cloud Marketplace com suporte a créditos de compromisso GCP
  • Clientes empresariais ganham inferência mais rápida, menor latência e agentes de voz em tempo real em mais de 70 idiomas

Experimente a Voz IA da ElevenLabs

Crie agentes de voz, gere fala em mais de 70 idiomas e acesse a plataforma completa ElevenLabs.

Experimente ElevenLabs Grátis →

O Que a Parceria Inclui

A colaboração ampliada cobre três áreas principais: infraestrutura, integração de modelos e distribuição empresarial.

70+ Idiomas Suportados
VMs G4 GPUs NVIDIA Blackwell
4.7/5 Nota GenMediaLab
Plurianual Duração da Parceria

Infraestrutura: A ElevenLabs executará seus modelos de voz em máquinas virtuais G4 do Google Cloud equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell. Essas VMs oferecem até 96 GB de memória por GPU, até 768 GB de memória GDDR7 total e até 9x mais throughput em comparação às instâncias G2 da geração anterior. O cluster de GPU maior suporta ciclos de treinamento mais rápidos e inferência com menor latência para implantações empresariais.

Integração de Modelos: Os modelos Gemini da Google estão sendo integrados à Plataforma de Agentes da ElevenLabs para raciocínio avançado e planejamento multi-etapas em assistentes de voz. Separadamente, o modelo de geração de vídeo Veo da Google está sendo adicionado à Plataforma Criativa da ElevenLabs, permitindo que equipes produzam vídeo e áudio juntos.

Distribuição Empresarial: As soluções ElevenLabs agora estão listadas no Google Cloud Marketplace, permitindo que empresas adquiram e implantem ferramentas de voz IA com faturamento e conformidade simplificados. Créditos de compromisso GCP existentes podem ser aplicados aos serviços ElevenLabs.

NVIDIA Blackwell: O Que Significa para Voz IA

As VMs G4 representam uma atualização significativa de hardware para a infraestrutura da ElevenLabs. As GPUs NVIDIA Blackwell incluem Tensor Cores e RT cores de quarta geração, projetados para cargas de trabalho de IA.

Inferência Mais Rápida

Até 9x mais throughput vs. instâncias G2 para geração de voz com menor latência

Treinamento de Modelos Maiores

768 GB de memória GDDR7 suportam treinamento de modelos multimodais maiores

Escalabilidade Flexível

Configurações de 1 a 8 GPUs com particionamento MIG para isolamento de carga

Alcance Global

A infraestrutura do Google Cloud entrega desempenho consistente em todas as regiões

O cofundador da ElevenLabs, Mati Staniszewski, disse que a atualização de hardware impacta diretamente a qualidade do produto: “Agora com VMs G4 equipadas com NVIDIA Blackwell, estamos levando nossos modelos multimodais ainda mais longe - inferência mais rápida, melhor confiabilidade, respostas instantâneas em todos os idiomas. O objetivo permanece o mesmo: criar agentes de voz que funcionem em escala empresarial sem compromissos.”

Ian Buck, VP e GM de Hyperscale e HPC na NVIDIA, acrescentou: “Este é exatamente o tipo de inovação de ecossistema que imaginamos com o Blackwell - ajudando pioneiros como a ElevenLabs a levar agentes de IA e ferramentas de mídia mais inteligentes e responsivos a todas as indústrias.”

Gemini Alimenta os Agentes de Voz ElevenLabs

A integração na Plataforma de Agentes traz as capacidades de raciocínio do Gemini aos assistentes de voz ElevenLabs. O Gemini cuida da camada de “pensamento” - entendendo contexto, planejando respostas multi-etapas e chamando funções - enquanto a ElevenLabs cuida da camada de voz com text-to-speech de baixa latência.

Essa combinação atende casos de uso empresariais em que agentes de voz precisam lidar com conversas complexas: suporte ao cliente com múltiplos sistemas, chamadas de vendas que buscam dados de produtos e simulações de treinamento que se adaptam às respostas do aprendiz.

Como Funciona

O Gemini fornece raciocínio ultrarrápido e chamada de funções como o cérebro de IA por trás dos agentes de voz. A ElevenLabs entrega a saída de voz humanizada. Juntos, criam IA conversacional que entende intenção, recupera informações e responde naturalmente em tempo real.

Integração Veo: Vídeo Encontra Voz

A integração na Plataforma Criativa traz o modelo de geração de vídeo Veo da Google junto às ferramentas de áudio da ElevenLabs. Equipes podem gerar conteúdo de vídeo e adicionar narração, efeitos sonoros e locução em um único fluxo de produção.

Casos de uso incluem publicidade, treinamento corporativo, comunicações internas e educação de clientes - cenários em que organizações precisam de vídeo e voz profissionais em escala.

Matt Renner, Presidente e Diretor de Receita do Google Cloud, enquadrou a parceria em termos empresariais: “Ao aproveitar a pilha completa de IA do Google Cloud, incluindo nossos modelos de IA líderes, bem como plataformas de computação acelerada de ponta da NVIDIA, a ElevenLabs está tornando possível que empresas transformem a forma como interagem com os usuários.”

Disponibilidade no Google Cloud Marketplace

As soluções de text-to-speech, IA conversacional e dublagem da ElevenLabs agora estão disponíveis diretamente pelo Google Cloud Marketplace. Isso importa para aquisição empresarial porque significa:

  • Faturamento simplificado através de contas existentes do Google Cloud
  • Créditos de compromisso GCP podem ser aplicados aos serviços ElevenLabs
  • Alinhamento de conformidade com as certificações de segurança do Google Cloud
  • Implantação mais rápida sem onboarding separado de fornecedor

Dai Vu, Diretor Geral de Marketplace e Programas ISV GTM do Google Cloud, observou: “Trazer a solução da ElevenLabs para o Google Cloud Marketplace ajudará os clientes a implantar, gerenciar e expandir rapidamente o text-to-speech, dublagem e IA conversacional na infraestrutura global e confiável do Google Cloud.”

O Que Isso Significa

Esta parceria reflete uma tendência mais ampla na IA: a tecnologia de voz está migrando de APIs isoladas para infraestrutura empresarial profundamente integrada. A ElevenLabs não é mais apenas um provedor de text-to-speech - seguindo movimentos como Scribe v2: fala para texto e a Iconic Voice Marketplace, está se posicionando como uma plataforma completa de voz IA respaldada por computação hyperscaler.

Para criadores e empresas que avaliam ferramentas de voz IA, as implicações práticas são:

  • Menor latência para aplicações em tempo real como dublagem ao vivo e agentes de voz
  • Melhor qualidade de modelo a partir do treinamento em hardware mais poderoso
  • Aquisição mais fácil para organizações já no Google Cloud
  • Fluxos de trabalho multimodais combinando vídeo Veo com áudio ElevenLabs

A integração Gemini é particularmente significativa. Agentes de voz que conseguem raciocinar sobre solicitações complexas e buscar dados de múltiplos sistemas representam a próxima fase da IA conversacional além de chatbots simples de pergunta e resposta.

Crie Agentes de Voz com ElevenLabs

Acesse text-to-speech, clonagem de voz, IA conversacional e dublagem em mais de 70 idiomas em uma única plataforma.

Comece com ElevenLabs →

Perguntas Frequentes

Para que são usadas as GPUs NVIDIA Blackwell nesta parceria?

A ElevenLabs usa GPUs NVIDIA RTX PRO 6000 Blackwell através de máquinas virtuais G4 do Google Cloud para treinar e servir seus modelos de voz IA. Essas GPUs fornecem até 9x mais throughput em comparação às instâncias da geração anterior, resultando em inferência mais rápida, menor latência e suporte ao treinamento de modelos multimodais maiores.

Como o Gemini se integra com a ElevenLabs?

Os modelos Gemini da Google estão integrados à Plataforma de Agentes da ElevenLabs para lidar com raciocínio e planejamento multi-etapas para assistentes de voz. O Gemini atua como o cérebro de IA que entende contexto e chama funções, enquanto a ElevenLabs fornece a saída de voz humanizada para a conversa.

Posso usar créditos GCP para serviços ElevenLabs?

Sim, clientes empresariais com créditos de compromisso existentes do Google Cloud Platform podem aplicá-los aos serviços de voz IA ElevenLabs adquiridos pelo Google Cloud Marketplace. Isso inclui soluções de text-to-speech, IA conversacional e dublagem.

Para que serve a integração Veo?

O modelo de geração de vídeo Veo da Google está sendo integrado à Plataforma Criativa da ElevenLabs, permitindo que equipes produzam vídeo e áudio em um único fluxo de trabalho. Isso atende casos de uso como publicidade, treinamento corporativo e educação de clientes, onde organizações precisam de conteúdo de vídeo e voz sincronizados.

Quantos idiomas a ElevenLabs suporta?

A ElevenLabs suporta criação e localização de conteúdo em mais de 70 idiomas. A parceria ampliada com o Google Cloud fornece a infraestrutura para entregar agentes de voz em tempo real e text-to-speech em todos os idiomas suportados com latência baixa consistente.


Fontes

  1. ElevenLabs Blog: ElevenLabs and Google Cloud
  2. PR Newswire: ElevenLabs Partners with Google Cloud
  3. Business Today: ElevenLabs Doubles Down On Google Cloud
  4. Google Cloud Blog: G4 VMs Powered by NVIDIA Blackwell

Este artigo foi útil?

0:00