ElevenLabs·Google Cloud 확대

Darius Z. 작성자: Darius Z. 5 분 읽기
ElevenLabs Google Cloud 음성 AI 파트너십을 상징하는 오디오 웨이브폼 모니터가 있는 스튜디오 헤드폰

ElevenLabs가 Google Cloud와의 다년간 파트너십을 연장하며, NVIDIA RTX PRO 6000 Blackwell GPU 기반 G4 가상 머신에 대한 접근권을 확보했습니다. 이번 협력으로 Google의 Gemini 모델이 ElevenLabs Agents Platform에 통합되고, Veo가 Creative Platform에 추가되어 비디오와 오디오를 동기화해 제작할 수 있게 됩니다.

핵심 요약

  • 다년간 Google Cloud 연장으로 NVIDIA Blackwell GPU 도입, 음성 모델 학습·추론 속도 향상
  • Gemini 모델이 ElevenLabs 음성 에이전트의 추론 및 다단계 계획 수립 담당
  • Veo 연동으로 팀이 단일 워크플로우에서 동기화된 비디오·오디오 콘텐츠 제작 가능
  • ElevenLabs 솔루션이 Google Cloud Marketplace에 출시, GCP 커밋 크레딧 지원
  • 엔터프라이즈 고객은 70개 이상 언어에서 더 빠른 추론, 낮은 지연, 실시간 음성 에이전트 이용

ElevenLabs 음성 AI 체험하기

음성 에이전트 구축, 70개 이상 언어로 음성 생성, ElevenLabs 플랫폼 전체 기능을 이용하세요.

ElevenLabs 무료 체험 →

파트너십 주요 내용

확대된 협력은 인프라, 모델 통합, 엔터프라이즈 유통 세 가지 핵심 영역을 포괄합니다.

70+ 지원 언어
G4 VMs NVIDIA Blackwell GPU
4.7/5 GenMediaLab 평점
다년간 파트너십 기간

인프라: ElevenLabs는 NVIDIA RTX PRO 6000 Blackwell GPU를 탑재한 Google Cloud G4 가상 머신에서 음성 모델을 운영합니다. 이 VM은 GPU당 최대 96GB 메모리, 총 최대 768GB GDDR7 메모리, 이전 세대 G2 인스턴스 대비 최대 9배 처리량을 제공합니다. 확장된 GPU 클러스터로 엔터프라이즈 배포 시 학습 주기 단축과 지연 시간 감소가 가능합니다.

모델 통합: Google의 Gemini 모델이 ElevenLabs Agents Platform에 통합되어 음성 어시스턴트의 고급 추론과 다단계 계획 수립을 담당합니다. 별도로 Google의 Veo 비디오 생성 모델이 ElevenLabs Creative Platform에 추가되어, 팀이 비디오와 오디오 콘텐츠를 한 워크플로우에서 제작할 수 있습니다.

엔터프라이즈 유통: ElevenLabs 솔루션이 Google Cloud Marketplace에 등록되어, 기업이 간소화된 결제와 규정 준수로 음성 AI 도구를 구매·배포할 수 있습니다. 기존 GCP 커밋 크레딧을 ElevenLabs 서비스에 사용할 수 있습니다.

NVIDIA Blackwell, 음성 AI에 미치는 영향

G4 VM은 ElevenLabs 인프라에 상당한 하드웨어 업그레이드를 의미합니다. NVIDIA Blackwell GPU는 AI 워크로드에 최적화된 4세대 Tensor Core와 RT Core를 포함합니다.

빠른 추론

G2 인스턴스 대비 최대 9배 처리량으로 지연 시간이 낮은 음성 생성

대규모 모델 학습

768GB GDDR7 메모리로 더 큰 멀티모달 모델 학습 지원

유연한 확장

1~8 GPU 구성과 MIG 파티셔닝으로 워크로드 격리

글로벌 도달

Google Cloud 인프라로 리전 전반 일관된 성능 제공

ElevenLabs 공동 창업자 Mati Staniszewski는 하드웨어 업그레이드가 제품 품질에 직접 영향을 준다고 말했습니다. “이제 NVIDIA Blackwell 기반 G4 VM으로 멀티모달 모델을 한층 더 발전시키고 있습니다. 더 빠른 추론, 더 나은 안정성, 언어를 넘나드는 즉각적인 응답이 가능해졌습니다. 목표는 그대로입니다. 타협 없이 엔터프라이즈 규모에서 동작하는 음성 에이전트를 만드는 것입니다.”

NVIDIA 하이퍼스케일·HPC 부문 VP 겸 GM Ian Buck는 “이것이 바로 Blackwell으로 기대했던 생태계 혁신입니다. ElevenLabs 같은 선구 기업이 더 똑똑하고 반응이 빠른 AI 에이전트와 미디어 도구를 모든 산업에 제공하는 데 도움이 됩니다”라고 덧붙였습니다.

Gemini로 구동되는 ElevenLabs 음성 에이전트

Agents Platform 통합으로 Gemini의 추론 능력이 ElevenLabs 음성 어시스턴트에 적용됩니다. Gemini는 컨텍스트 이해, 다단계 응답 계획, 함수 호출을 담당하는 ‘사고’ 계층을 맡고, ElevenLabs는 저지연 텍스트-투-스피치로 음성 계층을 담당합니다.

이 조합은 음성 에이전트가 복잡한 대화를 처리해야 하는 엔터프라이즈 사용 사례를 겨냥합니다. 여러 시스템을 연동하는 고객 지원, 제품 데이터를 활용하는 영업 통화, 학습자 응답에 맞춰 조정되는 교육 시뮬레이션 등이 해당됩니다.

작동 방식

Gemini가 음성 에이전트의 AI 두뇌로서 초고속 추론과 함수 호출을 제공합니다. ElevenLabs는 사람처럼 자연스러운 음성 출력을 제공합니다. 둘이 결합해 의도를 이해하고, 정보를 검색하고, 실시간으로 자연스럽게 응답하는 대화형 AI를 만듭니다.

Veo 연동: 비디오와 음성의 결합

Creative Platform 통합으로 Google의 Veo 비디오 생성 모델이 ElevenLabs 오디오 도구와 함께 제공됩니다. 팀은 한 제작 워크플로우 안에서 비디오 콘텐츠를 생성하고 보이스오버, 효과음, 내레이션을 추가할 수 있습니다.

타깃 사용 사례에는 광고, 기업 교육, 내부 커뮤니케이션, 고객 교육이 포함됩니다. 조직이 전문적인 비디오와 음성 콘텐츠를 대규모로 필요로 하는 시나리오입니다.

Google Cloud 사장 겸 최고 매출 책임자 Matt Renner는 파트너십을 엔터프라이즈 관점에서 설명했습니다. “Google Cloud의 선도 AI 모델을 포함한 전체 AI 스택과 NVIDIA의 최첨단 가속 컴퓨팅 플랫폼을 활용해 ElevenLabs는 기업이 사용자와의 상호작용 방식을 혁신할 수 있게 합니다.”

Google Cloud Marketplace 출시

ElevenLabs의 텍스트-투-스피치, 대화형 AI, 더빙 솔루션이 Google Cloud Marketplace를 통해 직접 이용 가능해졌습니다. 엔터프라이즈 조달에 중요한 점은 다음과 같습니다.

  • 간소화된 결제 – 기존 Google Cloud 계정으로 처리
  • GCP 커밋 크레딧 – ElevenLabs 서비스에 사용 가능
  • 규정 준수 정렬 – Google Cloud 보안 인증과 일치
  • 신속한 배포 – 별도 벤더 온보딩 없이 진행

Google Cloud Marketplace 및 ISV GTM 프로그램 Managing Director Dai Vu는 “ElevenLabs 솔루션을 Google Cloud Marketplace에 출시함으로써 고객이 Google Cloud의 신뢰할 수 있는 글로벌 인프라에서 텍스트-투-스피치, 더빙, 대화형 AI를 빠르게 배포·관리·확장할 수 있게 됩니다”라고 말했습니다.

시사점

이 파트너십은 AI 전반의 흐름을 반영합니다. 음성 기술이 독립 API에서 하이퍼스케일러 컴퓨팅 기반의 통합 엔터프라이즈 인프라로 이동하고 있습니다. ElevenLabs는 더 이상 단순한 텍스트-투-스피치 제공업체가 아니라, Scribe v2 음성-텍스트 변환Iconic Voice 마켓플레이스와 같은 움직임을 따라 하이퍼스케일러 컴퓨팅을 기반으로 한 종합 음성 AI 플랫폼으로 자리매김하고 있습니다.

음성 AI 도구를 검토하는 크리에이터와 기업에게 실질적인 의미는 다음과 같습니다.

  • 낮은 지연 – 라이브 더빙, 음성 에이전트 등 실시간 애플리케이션에 유리
  • 향상된 모델 품질 – 더 강력한 하드웨어에서의 학습
  • 쉬운 조달 – 이미 Google Cloud를 사용 중인 조직에 적합
  • 멀티모달 워크플로우 – Veo 비디오와 ElevenLabs 오디오 결합

Gemini 통합은 특히 의미가 큽니다. 복잡한 요청을 추론하고 여러 시스템에서 데이터를 가져올 수 있는 음성 에이전트는 단순 Q&A 챗봇을 넘어선 대화형 AI의 다음 단계를 보여줍니다.

ElevenLabs로 음성 에이전트 구축하기

70개 이상 언어에서 텍스트-투-스피치, 음성 복제, 대화형 AI, 더빙을 단일 플랫폼에서 이용하세요.

ElevenLabs 시작하기 →

자주 묻는 질문

이 파트너십에서 NVIDIA Blackwell GPU는 어떤 용도로 사용되나요?

ElevenLabs는 Google Cloud G4 가상 머신을 통해 NVIDIA RTX PRO 6000 Blackwell GPU를 사용해 음성 AI 모델을 학습하고 서빙합니다. 이 GPU는 이전 세대 인스턴스 대비 최대 9배 처리량을 제공해, 더 빠른 추론, 낮은 지연, 더 큰 멀티모달 모델 학습 지원을 가능하게 합니다.

Gemini는 ElevenLabs와 어떻게 통합되나요?

Google의 Gemini 모델이 ElevenLabs Agents Platform에 통합되어 음성 어시스턴트의 추론과 다단계 계획 수립을 담당합니다. Gemini는 컨텍스트를 이해하고 함수를 호출하는 AI 두뇌 역할을 하고, ElevenLabs는 대화를 위한 사람처럼 자연스러운 음성 출력을 제공합니다.

GCP 크레딧으로 ElevenLabs 서비스를 이용할 수 있나요?

네. 기존 Google Cloud Platform 커밋 크레딧을 보유한 엔터프라이즈 고객은 Google Cloud Marketplace를 통해 구매한 ElevenLabs 음성 AI 서비스에 이를 적용할 수 있습니다. 텍스트-투-스피치, 대화형 AI, 더빙 솔루션이 포함됩니다.

Veo 연동은 어떤 용도인가요?

Google의 Veo 비디오 생성 모델이 ElevenLabs Creative Platform에 통합되어, 팀이 한 워크플로우에서 비디오와 오디오 콘텐츠를 제작할 수 있습니다. 광고, 기업 교육, 고객 교육처럼 조직이 동기화된 비디오와 음성 콘텐츠가 필요한 사용 사례를 겨냥합니다.

ElevenLabs는 몇 개 언어를 지원하나요?

ElevenLabs는 70개 이상 언어에서 콘텐츠 제작과 현지화를 지원합니다. 확대된 Google Cloud 파트너십은 지원 언어 전반에서 일관된 저지연으로 실시간 음성 에이전트와 텍스트-투-스피치를 제공하는 인프라를 마련합니다.


출처

  1. ElevenLabs Blog: ElevenLabs and Google Cloud
  2. PR Newswire: ElevenLabs Partners with Google Cloud
  3. Business Today: ElevenLabs Doubles Down On Google Cloud
  4. Google Cloud Blog: G4 VMs Powered by NVIDIA Blackwell

이 글이 도움이 되셨나요?

0:00