ElevenLabs توسّع شراكتها مع Google Cloud عبر معالجات NVIDIA Blackwell

بقلم GenMediaLab 5 دقائق للقراءة
سماعات استوديو على مكتب مع شاشات موجات صوتية لشراكة ElevenLabs و Google Cloud في صوت الذكاء الاصطناعي

وقّعت ElevenLabs على تمديد شراكتها مع Google Cloud لعدة سنوات، مما يمنحها الوصول إلى أجهزة افتراضية G4 مدعومة بمعالجات NVIDIA RTX PRO 6000 Blackwell. تشمل الصفقة أيضاً دمج نماذج Gemini من Google في منصة Agents من ElevenLabs، وVeo في منصة Creative لإنتاج الفيديو والصوت المتزامن.

النقاط الرئيسية

  • تمديد الشراكة مع Google Cloud لعدة سنوات يجلب معالجات NVIDIA Blackwell لتدريب واستنتاج نماذج الصوت بشكل أسرع
  • نماذج Gemini تدعم الآن التفكير والتخطيط متعدد الخطوات داخل وكلاء الصوت من ElevenLabs
  • دمج Veo يتيح للفرق إنتاج محتوى فيديو وصوت متزامن من سير عمل واحد
  • حلول ElevenLabs متاحة الآن على Google Cloud Marketplace مع دعم رصيد التزام GCP
  • العملاء المؤسسيون يحصلون على استنتاج أسرع وزمن انتقال أقل ووكلاء صوت في الوقت الفعلي بأكثر من 70 لغة

جرّب صوت ElevenLabs بالذكاء الاصطناعي

أنشئ وكلاء صوت، ولّد كلاماً بأكثر من 70 لغة، واستفد من منصة ElevenLabs الكاملة.

جرّب ElevenLabs مجاناً →

ما تتضمنه الشراكة

تغطي التعاون الموسّع ثلاثة مجالات أساسية: البنية التحتية، ودمج النماذج، والتوزيع المؤسسي.

70+ اللغات المدعومة
أجهزة G4 معالجات NVIDIA Blackwell
4.7/5 تقييم GenMediaLab
عدة سنوات مدة الشراكة

البنية التحتية: ستشغّل ElevenLabs نماذجها الصوتية على أجهزة افتراضية G4 من Google Cloud مجهّزة بمعالجات NVIDIA RTX PRO 6000 Blackwell. توفر هذه الأجهزة حتى 96 جيجابايت ذاكرة لكل معالج، وحتى 768 جيجابايت إجمالي ذاكرة GDDR7، وحتى 9 أضعاف الإنتاجية مقارنة بأجهزة الجيل السابق G2. مجموعة المعالجات الأكبر تدعم دورات تدريب أسرع واستنتاج بزمن انتقال أقل للنشر المؤسسي.

دمج النماذج: يتم دمج نماذج Gemini من Google في منصة Agents من ElevenLabs للتفكير المتقدم والتخطيط متعدد الخطوات في المساعدين الصوتيين. بشكل منفصل، يُضاف نموذج Veo لتوليد الفيديو من Google إلى منصة Creative من ElevenLabs، مما يتيح للفرق إنتاج محتوى الفيديو والصوت معاً.

التوزيع المؤسسي: حلول ElevenLabs مدرجة الآن على Google Cloud Marketplace، مما يتيح للمؤسسات شراء ونشر أدوات الصوت بالذكاء الاصطناعي مع فوترة وامتثال مبسّطين. يمكن تطبيق أرصدة التزام GCP الحالية على خدمات ElevenLabs.

NVIDIA Blackwell: ماذا يعني للصوت بالذكاء الاصطناعي

تمثّل أجهزة G4 ترقية هاردوير كبيرة لبنية ElevenLabs التحتية. تتضمن معالجات NVIDIA Blackwell نوى Tensor من الجيل الرابع ونوى RT، مصممة خصيصاً لأحمال عمل الذكاء الاصطناعي.

استنتاج أسرع

حتى 9 أضعاف الإنتاجية مقارنة بأجهزة G2 لتوليد صوت بزمن انتقال أقل

تدريب نماذج أكبر

ذاكرة GDDR7 بسعة 768 جيجابايت تدعم تدريب نماذج متعددة الوسائط أكبر

توسّع مرن

تكوينات من 1 إلى 8 معالجات مع تقسيم MIG لعزل أحمال العمل

وصول عالمي

بنية Google Cloud التحتية توفر أداءً متسقاً عبر المناطق

قال ماتي ستانيسزفسكي، الشريك المؤسس لـ ElevenLabs، إن ترقية الهاردوير تؤثر مباشرة على جودة المنتج: “الآن مع أجهزة G4 المدعومة بـ NVIDIA Blackwell، ندفع نماذجنا متعددة الوسائط إلى أبعد-استنتاج أسرع، موثوقية أفضل، ردود فورية عبر اللغات. الهدف يبقى نفسه: صنع وكلاء صوت يعملون على نطاق مؤسسي دون تنازلات.”

أضاف إيان باك، نائب الرئيس والمدير العام لـ Hyperscale و HPC في NVIDIA: “هذا بالضبط نوع الابتكار في النظام البيئي الذي تصوّرناه مع Blackwell-مساعدة رواد مثل ElevenLabs على تقديم وكلاء ذكاء اصطناعي وأدوات وسائط أذكى وأكثر استجابة لكل صناعة.”

Gemini يدعم وكلاء الصوت من ElevenLabs

دمج منصة Agents يجلب قدرات التفكير في Gemini إلى مساعدي ElevenLabs الصوتيين. يتولى Gemini طبقة “التفكير”-فهم السياق، والتخطيط لردود متعددة الخطوات، واستدعاء الدوال-بينما يتولى ElevenLabs طبقة الصوت مع تحويل النص إلى كلام بزمن انتقال منخفض.

يستهدف هذا المزيج حالات الاستخدام المؤسسية حيث يحتاج وكلاء الصوت إلى التعامل مع محادثات معقدة: دعم العملاء مع أنظمة متعددة، مكالمات مبيعات تسحب بيانات المنتجات، ومحاكاة تدريب تتكيف مع ردود المتعلمين.

كيف يعمل

يوفر Gemini تفكيراً فائق السرعة واستدعاء دوال كدماغ الذكاء الاصطناعي خلف وكلاء الصوت. ElevenLabs تقدم مخرجات الصوت الشبيهة بالإنسان. معاً، يخلقان ذكاءً اصطناعياً محادثياً يفهم النية، يسترجع المعلومات، ويستجيب بشكل طبيعي في الوقت الفعلي.

دمج Veo: الفيديو يلتقي بالصوت

دمج منصة Creative يجلب نموذج Veo لتوليد الفيديو من Google جنباً إلى جنب مع أدوات الصوت من ElevenLabs. يمكن للفرق توليد محتوى فيديو وإضافة التعليقات الصوتية والمؤثرات الصوتية والسرد ضمن سير إنتاج واحد.

تشمل حالات الاستخدام المستهدفة الإعلانات، التدريب المؤسسي، الاتصالات الداخلية، وتعليم العملاء-سيناريوهات تحتاج فيها المنظمات إلى محتوى فيديو وصوت احترافي على نطاق واسع.

صاغ مات رينر، الرئيس والمدير التنفيذي للإيرادات في Google Cloud، الشراكة بمصطلحات مؤسسية: “من خلال الاستفادة من مجموعة الذكاء الاصطناعي الكاملة من Google Cloud، بما في ذلك نماذجنا الرائدة، بالإضافة إلى منصات الحوسبة المتسارعة المتطورة من NVIDIA، تجعل ElevenLabs من الممكن للشركات تحويل كيفية تفاعلها مع المستخدمين.”

التوفر على Google Cloud Marketplace

حلول تحويل النص إلى كلام، والذكاء الاصطناعي المحادثي، والدبلجة من ElevenLabs متاحة الآن مباشرة عبر Google Cloud Marketplace. هذا مهم للمشتريات المؤسسية لأنه يعني:

  • فوترة مبسطة عبر حسابات Google Cloud الحالية
  • أرصدة التزام GCP يمكن تطبيقها على خدمات ElevenLabs
  • توافق الامتثال مع شهادات أمان Google Cloud
  • نشر أسرع دون إعداد مورد منفصل

أشار داي فو، المدير الإداري لـ Marketplace وبرامج ISV GTM في Google Cloud: “جلب حل ElevenLabs إلى Google Cloud Marketplace سيساعد العملاء على النشر والإدارة والنمو بسرعة في تحويل النص إلى كلام والدبلجة والذكاء الاصطناعي المحادثي على البنية التحتية العالمية الموثوقة من Google Cloud.”

ماذا يعني هذا

تعكس هذه الشراكة اتجاهاً أوسع في الذكاء الاصطناعي: تقنية الصوت تنتقل من واجهات برمجة التطبيقات المستقلة إلى بنية مؤسسية متكاملة بعمق. ElevenLabs لم تعد مجرد مزود لتحويل النص إلى كلام - في أعقاب خطوات مثل Scribe v2 للتحويل من الكلام إلى نص وسوق الأصوات الأيقونية، إنها تضع نفسها كمنصة صوت ذكاء اصطناعي كاملة مدعومة بحوسبة hyperscaler.

للمبدعين والشركات التي تقيّم أدوات الصوت بالذكاء الاصطناعي، الآثار العملية هي:

  • زمن انتقال أقل للتطبيقات في الوقت الفعلي مثل الدبلجة المباشرة ووكلاء الصوت
  • جودة نموذج أفضل من التدريب على هاردوير أقوى
  • شراء أسهل للمنظمات الموجودة بالفعل على Google Cloud
  • سير عمل متعدد الوسائط يجمع فيديو Veo مع صوت ElevenLabs

دمج Gemini مهم بشكل خاص. وكلاء الصوت القادرون على التفكير في الطلبات المعقدة وسحب البيانات من أنظمة متعددة يمثلون المرحلة التالية من الذكاء الاصطناعي المحادثي بعد روبوتات الدردشة البسيطة للأسئلة والأجوبة.

أنشئ وكلاء صوت مع ElevenLabs

الوصول إلى تحويل النص إلى كلام، واستنساخ الصوت، والذكاء الاصطناعي المحادثي، والدبلجة بأكثر من 70 لغة على منصة واحدة.

ابدأ مع ElevenLabs →

الأسئلة الشائعة

ما استخدام معالجات NVIDIA Blackwell في هذه الشراكة؟

تستخدم ElevenLabs معالجات NVIDIA RTX PRO 6000 Blackwell عبر أجهزة G4 الافتراضية من Google Cloud لتدريب وتقديم نماذج الصوت بالذكاء الاصطناعي. توفر هذه المعالجات حتى 9 أضعاف الإنتاجية مقارنة بأجهزة الجيل السابق، مما يؤدي إلى استنتاج أسرع وزمن انتقال أقل ودعم تدريب نماذج متعددة الوسائط أكبر.

كيف يندمج Gemini مع ElevenLabs؟

نماذج Gemini من Google مدمجة في منصة Agents من ElevenLabs للتعامل مع التفكير والتخطيط متعدد الخطوات للمساعدين الصوتيين. يعمل Gemini كدماغ الذكاء الاصطناعي الذي يفهم السياق ويستدعي الدوال، بينما تقدم ElevenLabs مخرجات الصوت الشبيهة بالإنسان للمحادثة.

هل يمكنني استخدام أرصدة GCP لخدمات ElevenLabs؟

نعم، يمكن للعملاء المؤسسيين الذين لديهم أرصدة التزام Google Cloud Platform الحالية تطبيقها على خدمات الصوت بالذكاء الاصطناعي من ElevenLabs المشتراة عبر Google Cloud Marketplace. يشمل ذلك تحويل النص إلى كلام، والذكاء الاصطناعي المحادثي، وحلول الدبلجة.

ما هو دمج Veo؟

يتم دمج نموذج Veo لتوليد الفيديو من Google في منصة Creative من ElevenLabs، مما يتيح للفرق إنتاج محتوى الفيديو والصوت ضمن سير عمل واحد. يستهدف حالات استخدام مثل الإعلانات، التدريب المؤسسي، وتعليم العملاء حيث تحتاج المنظمات إلى محتوى فيديو وصوت متزامن.

كم لغة تدعمها ElevenLabs؟

تدعم ElevenLabs إنشاء المحتوى والتدويل بأكثر من 70 لغة. توفر شراكة Google Cloud الموسعة البنية التحتية لتقديم وكلاء صوت وتحويل النص إلى كلام في الوقت الفعلي عبر جميع اللغات المدعومة مع زمن انتقال منخفض متسق.


المصادر

  1. مدونة ElevenLabs: ElevenLabs و Google Cloud
  2. PR Newswire: ElevenLabs تشارك مع Google Cloud
  3. Business Today: ElevenLabs تضاعف استثمارها في Google Cloud
  4. مدونة Google Cloud: أجهزة G4 المدعومة بـ NVIDIA Blackwell

هل كانت هذه المقالة مفيدة؟