Google Veo 2 و Imagen 3: ما يحتاج المبدعون معرفته عن نماذج الذكاء الاصطناعي الجديدة

بقلم GenMediaLab • ١٦ ديسمبر ٢٠٢٤ • 6 دقائق للقراءة

النقاط الرئيسية

✓ يولد Veo 2 فيديو بدقة 4K يصل إلى عدة دقائق مع فيزياء وواقعية محسنة
✓ ينتج Imagen 3 صوراً فوتوغرافية واقعية عبر أنماط فنية متنوعة
✓ أداة 'Whisk' الجديدة تتيح لك إعادة مزج الصور باستخدام المواضيع والمشاهد والأنماط
✓ متاح الآن عبر VideoFX و ImageFX في Google Labs (قائمة انتظار)

ما الذي حدث

في 16 ديسمبر 2024، أعلنت Google DeepMind عن Veo 2 و Imagen 3 المحدث - أحدث نماذج توليد الفيديو والصور التي تحقق نتائج متطورة في التقييمات البشرية.

النماذج الجديدة متاحة من خلال أدوات Google Labs VideoFX (للفيديو) و ImageFX (للصور)، إلى جانب أداة تجريبية جديدة تسمى Whisk تتيح للمستخدمين إعادة مزج الصور من خلال دمج مواضيع ومشاهد وأنماط مختلفة.

“ينشئ Veo 2 مقاطع فيديو عالية الجودة بشكل لا يصدق في مجموعة واسعة من المواضيع والأنماط. في المقارنات المباشرة التي يحكم عليها المقيمون البشريون، حقق Veo 2 نتائج متطورة ضد النماذج الرائدة.” — مدونة Google

الميزات الرئيسية لـ Veo 2

فهم السينماتوغرافيا: يفهم Veo 2 لغة السينما. اطلب “لقطة تتبع بزاوية منخفضة” أو حدد “عدسة 18 مم” وسيقدم الجمالية واسعة الزاوية المناسبة. اطلب “عمق مجال ضحل” وسيضبب الخلفيات بشكل مناسب.

فيزياء وواقعية محسنة: على عكس نماذج الفيديو بالذكاء الاصطناعي السابقة التي قد “تنقل” كرة سلة إلى سلة، يجسد Veo 2 فيزياء واقعية. عندما تفوت اللقطة، ترى الارتداد الفعلي.

الدقة والطول: يمكن توليد مقاطع الفيديو بدقة تصل إلى 4K وتمديدها إلى عدة دقائق - تحسين كبير مقارنة بالمنافسين.

أوهام أقل: تدعي Google أن Veo 2 ينتج عدداً أقل من القطع الأثرية غير المرغوب فيها مثل الأصابع الإضافية أو الكائنات غير المتوقعة مقارنة بالنماذج الأخرى.

لماذا هذا مهم للمبدعين

لمبدعي YouTube ووسائل التواصل الاجتماعي

يعني فهم Veo 2 للسينماتوغرافيا أنه يمكنك توليد B-roll والانتقالات ولقطات التأسيس التي تبدو مصورة بشكل احترافي. حدد حركة الكاميرا الدقيقة ونمط العدسة في مطالباتك للحصول على لقطات بجودة البث.

للمسوقين والشركات

يخلق مزيج قدرات فيديو Veo 2 وتوليد صور Imagen 3 مجموعة قوية لإنتاج محتوى تسويقي. أنشئ تصورات المنتج ومقاطع فيديو توضيحية وأصول وسائل التواصل الاجتماعي دون إنتاج مكلف.

للمصممين والفنانين

تفتح أداة Whisk الجديدة إمكانيات إبداعية لاستكشاف المفاهيم السريع. ارفع موضوعاً (منتجك)، ومشهداً (البيئة المطلوبة)، ومرجع نمط - يجمع Whisk بينها في اختلافات جديدة. مثالي للوحات المزاج وفن المفاهيم والتصور الإبداعي.

المنافسة تتصاعد

يضع إعلان Google ضغطاً على المنافسين مثل Sora من OpenAI و Runway و Pika Labs وغيرهم. بالنسبة للمبدعين، تعني هذه المنافسة أدوات أفضل وتحسينات أسرع والمزيد من الخيارات.

جرب VideoFX من Google

انضم إلى قائمة الانتظار للوصول إلى Veo 2 وإنشاء مقاطع فيديو بالذكاء الاصطناعي متطورة

انضم إلى قائمة الانتظار →

كيفية البدء

VideoFX (لتوليد فيديو Veo 2)

زر labs.google/fx/tools/video-fx
سجل في قائمة الانتظار
بمجرد الموافقة، ابدأ بمطالبات بسيطة وتكرار
استخدم مصطلحات السينماتوغرافيا للحصول على نتائج أفضل (أنواع العدسات، أنواع اللقطات، الإضاءة)

ImageFX (لصور Imagen 3)

اذهب إلى labs.google/fx/tools/image-fx
متاح الآن في أكثر من 100 دولة
جرب أنماط فنية محددة ومطالبات مفصلة للحصول على أفضل النتائج

Whisk (لإعادة مزج الصور)

زر labs.google/fx/tools/whisk
متاح حالياً في الولايات المتحدة
ارفع أو أنشئ صوراً للموضوع والمشهد والنمط
دع الذكاء الاصطناعي يجمعها في إبداعات جديدة

السلامة والعلامة المائية

تتضمن جميع مخرجات Veo 2 علامة مائية SynthID غير مرئية لتحديد المحتوى المولد بالذكاء الاصطناعي. يساعد هذا في مكافحة المعلومات المضللة ويضمن الشفافية حول أصل المحتوى.

قيدت Google توليد الشخصيات العامة والصور الواقعية دون موافقة، وكانت متعمدة في طرح الوصول لإدارة السلامة.

الخلاصة

يمثل Veo 2 و Imagen 3 قفزة كبيرة إلى الأمام في جودة الوسائط المولدة بالذكاء الاصطناعي. بالنسبة للمبدعين، يعني هذا أدوات أكثر قوة للتصور والنماذج الأولية وإنشاء المحتوى. المفتاح هو تعلم المطالبة بفعالية - استخدام لغة السينماتوغرافيا للفيديو وأوصاف الأنماط المفصلة للصور.

بينما لن تحل هذه الأدوات محل الإنتاج الاحترافي للمحتوى عالي المخاطر، فهي لا تقدر بثمن للنماذج الأولية السريعة ومحتوى وسائل التواصل الاجتماعي والاستكشاف الإبداعي.