ElevenLabs Amplia l'Accordo con Google Cloud con GPU NVIDIA Blackwell

Di GenMediaLab 5 min di lettura
Cuffie da studio su scrivania con monitor di forme d'onda audio per la partnership voce IA ElevenLabs Google Cloud

ElevenLabs ha firmato un’estensione pluriennale della partnership con Google Cloud, ottenendo accesso alle macchine virtuali G4 alimentate dalle GPU NVIDIA RTX PRO 6000 Blackwell. L’accordo integra inoltre i modelli Gemini di Google nella piattaforma Agents di ElevenLabs e Veo nella Creative Platform per la produzione sincronizzata di video e audio.

Punti Chiave

  • L'estensione pluriennale con Google Cloud porta le GPU NVIDIA Blackwell per addestramento e inferenza più veloci dei modelli vocali
  • I modelli Gemini alimentano ora il ragionamento e la pianificazione multi-step negli agenti vocali ElevenLabs
  • L'integrazione Veo consente ai team di produrre contenuti video e audio sincronizzati in un unico flusso di lavoro
  • Le soluzioni ElevenLabs sono ora disponibili su Google Cloud Marketplace con supporto ai crediti di impegno GCP
  • I clienti enterprise beneficiano di inferenza più veloce, latenza ridotta e agenti vocali in tempo reale in oltre 70 lingue

Prova la Voce IA di ElevenLabs

Crea agenti vocali, genera sintesi vocale in oltre 70 lingue e accedi alla piattaforma ElevenLabs completa.

Prova ElevenLabs Gratis →

Cosa Include la Partnership

La collaborazione ampliata copre tre ambiti principali: infrastruttura, integrazione modelli e distribuzione enterprise.

70+ Lingue Supportate
VM G4 GPU NVIDIA Blackwell
4.7/5 Valutazione GenMediaLab
Pluriennale Durata Partnership

Infrastruttura: ElevenLabs eseguirà i propri modelli vocali sulle macchine virtuali G4 di Google Cloud equipaggiate con GPU NVIDIA RTX PRO 6000 Blackwell. Queste VM offrono fino a 96 GB di memoria per GPU, fino a 768 GB totali di memoria GDDR7 e fino a 9x la produttività rispetto alle istanze G2 di generazione precedente. Il cluster GPU più ampio supporta cicli di addestramento più rapidi e inferenza a bassa latenza per i deployment enterprise.

Integrazione modelli: I modelli Gemini di Google vengono integrati nella piattaforma Agents di ElevenLabs per ragionamento avanzato e pianificazione multi-step negli assistenti vocali. In parallelo, il modello di generazione video Veo di Google viene aggiunto alla Creative Platform di ElevenLabs, consentendo ai team di produrre contenuti video e audio insieme.

Distribuzione enterprise: Le soluzioni ElevenLabs sono ora presenti su Google Cloud Marketplace, permettendo alle aziende di acquistare e distribuire strumenti di voce IA con fatturazione e conformità semplificate. I crediti di impegno GCP esistenti possono essere applicati ai servizi ElevenLabs.

NVIDIA Blackwell: Cosa Significa per la Voce IA

Le VM G4 rappresentano un significativo upgrade hardware per l’infrastruttura di ElevenLabs. Le GPU NVIDIA Blackwell includono Tensor Core e RT core di quarta generazione, progettati per carichi di lavoro AI.

Inferenza Più Veloce

Fino a 9x la produttività rispetto alle istanze G2 per generazione vocale a bassa latenza

Addestramento Modelli Più Grandi

768 GB di memoria GDDR7 supportano l'addestramento di modelli multimodali più grandi

Scalabilità Flessibile

Configurazioni da 1 a 8 GPU con partizionamento MIG per isolamento dei carichi

Copertura Globale

L'infrastruttura Google Cloud garantisce prestazioni uniformi in tutte le regioni

Il co-fondatore di ElevenLabs Mati Staniszewski ha dichiarato che l’upgrade hardware impatta direttamente sulla qualità del prodotto: «Ora con le VM G4 alimentate da NVIDIA Blackwell, stiamo spingendo ancora oltre i nostri modelli multimodali: inferenza più veloce, maggiore affidabilità, risposte istantanee in tutte le lingue. L’obiettivo resta lo stesso: creare agenti vocali che funzionano a scala enterprise senza compromessi.»

Ian Buck, VP e GM di Hyperscale and HPC at NVIDIA, ha aggiunto: «È esattamente il tipo di innovazione ecosistemica che avevamo immaginato con Blackwell: aiutare pionieri come ElevenLabs a portare agenti IA e strumenti multimediali più intelligenti e reattivi in ogni settore.»

Gemini Alimenta gli Agenti Vocali ElevenLabs

L’integrazione nella piattaforma Agents porta le capacità di ragionamento di Gemini negli assistenti vocali ElevenLabs. Gemini gestisce il livello «pensiero»: comprensione del contesto, pianificazione di risposte multi-step e chiamate a funzioni, mentre ElevenLabs gestisce il livello vocale con text-to-speech a bassa latenza.

Questa combinazione è pensata per casi d’uso enterprise in cui gli agenti vocali devono gestire conversazioni complesse: supporto clienti con più sistemi, chiamate di vendita che recuperano dati sui prodotti e simulazioni formative che si adattano alle risposte degli utenti.

Come Funziona

Gemini fornisce ragionamento ultra-rapido e chiamate a funzioni come cervello AI dietro gli agenti vocali. ElevenLabs produce l’output vocale naturale. Insieme creano un’IA conversazionale che comprende l’intento, recupera informazioni e risponde in modo naturale in tempo reale.

Integrazione Veo: Video e Voce Insieme

L’integrazione nella Creative Platform porta il modello di generazione video Veo di Google accanto agli strumenti audio di ElevenLabs. I team possono generare contenuti video e aggiungere voiceover, effetti sonori e narrazione in un unico flusso di produzione.

I casi d’uso target includono pubblicità, formazione aziendale, comunicazioni interne e formazione clienti: scenari in cui le organizzazioni necessitano sia di video professionali che di contenuti vocali su scala.

Matt Renner, Presidente e Chief Revenue Officer di Google Cloud, ha inquadrato la partnership in termini enterprise: «Sfruttando lo stack AI completo di Google Cloud, inclusi i nostri modelli AI leader, oltre alle piattaforme di calcolo accelerato all’avanguardia di NVIDIA, ElevenLabs rende possibile alle aziende trasformare il modo in cui interagiscono con gli utenti.»

Disponibilità su Google Cloud Marketplace

Le soluzioni di text-to-speech, IA conversazionale e doppiaggio di ElevenLabs sono ora disponibili direttamente su Google Cloud Marketplace. Questo è rilevante per gli acquisti enterprise perché significa:

  • Fatturazione semplificata tramite account Google Cloud esistenti
  • Crediti di impegno GCP applicabili ai servizi ElevenLabs
  • Allineamento alla conformità con le certificazioni di sicurezza Google Cloud
  • Deployment più rapido senza onboarding separato con altri fornitori

Dai Vu, Managing Director di Marketplace e ISV GTM Programs di Google Cloud, ha osservato: «Portare la soluzione ElevenLabs su Google Cloud Marketplace aiuterà i clienti a distribuire, gestire e far crescere rapidamente text-to-speech, doppiaggio e IA conversazionale sull’infrastruttura globale e affidabile di Google Cloud.»

Cosa Significa

Questa partnership riflette una tendenza più ampia nell’IA: la tecnologia vocale sta passando da API standalone a infrastruttura enterprise profondamente integrata. ElevenLabs non è più solo un fornitore di text-to-speech - dopo mosse come Scribe v2 per speech-to-text e l’Iconic Voice Marketplace, si sta posizionando come piattaforma completa di voce IA supportata da infrastruttura hyperscaler.

Per creatori e aziende che valutano strumenti di voce IA, le implicazioni pratiche sono:

  • Latenza ridotta per applicazioni in tempo reale come doppiaggio live e agenti vocali
  • Qualità modelli migliore grazie all’addestramento su hardware più potente
  • Acquisti più semplici per le organizzazioni già su Google Cloud
  • Flussi di lavoro multimodali che combinano video Veo con audio ElevenLabs

L’integrazione Gemini è particolarmente significativa. Gli agenti vocali che possono ragionare su richieste complesse e recuperare dati da più sistemi rappresentano la fase successiva dell’IA conversazionale, oltre i semplici chatbot domanda-risposta.

Crea Agenti Vocali con ElevenLabs

Accedi a text-to-speech, clonazione vocale, IA conversazionale e doppiaggio in oltre 70 lingue su una singola piattaforma.

Inizia con ElevenLabs →

Domande Frequenti

A cosa servono le GPU NVIDIA Blackwell in questa partnership?

ElevenLabs utilizza le GPU NVIDIA RTX PRO 6000 Blackwell tramite le macchine virtuali G4 di Google Cloud per addestrare e servire i propri modelli di voce IA. Queste GPU offrono fino a 9x la produttività rispetto alle istanze di generazione precedente, con inferenza più veloce, latenza ridotta e supporto per l'addestramento di modelli multimodali più grandi.

Come si integra Gemini con ElevenLabs?

I modelli Gemini di Google sono integrati nella piattaforma Agents di ElevenLabs per gestire ragionamento e pianificazione multi-step negli assistenti vocali. Gemini agisce come cervello AI che comprende il contesto e chiama funzioni, mentre ElevenLabs fornisce l'output vocale naturale per la conversazione.

Posso usare i crediti GCP per i servizi ElevenLabs?

Sì, i clienti enterprise con crediti di impegno Google Cloud Platform esistenti possono applicarli ai servizi di voce IA ElevenLabs acquistati tramite Google Cloud Marketplace. Questo include text-to-speech, IA conversazionale e soluzioni di doppiaggio.

A cosa serve l'integrazione Veo?

Il modello di generazione video Veo di Google viene integrato nella Creative Platform di ElevenLabs, consentendo ai team di produrre sia video che audio in un unico flusso di lavoro. Questo si rivolge a casi d'uso come pubblicità, formazione aziendale e formazione clienti, dove le organizzazioni necessitano di contenuti video e vocali sincronizzati.

Quante lingue supporta ElevenLabs?

ElevenLabs supporta la creazione e localizzazione di contenuti in oltre 70 lingue. La partnership ampliata con Google Cloud fornisce l'infrastruttura per offrire agenti vocali in tempo reale e text-to-speech in tutte le lingue supportate con latenza costantemente bassa.


Fonti

  1. ElevenLabs Blog: ElevenLabs and Google Cloud
  2. PR Newswire: ElevenLabs Partners with Google Cloud
  3. Business Today: ElevenLabs Doubles Down On Google Cloud
  4. Google Cloud Blog: G4 VMs Powered by NVIDIA Blackwell

Questo articolo ti è stato utile?