أعلنت شركة "غوغل" خلال مؤتمر I/O 2025 عن العديد من التقنيات الحديثة، من بينها نموذج Veo3 الذي يستخدم الذكاء الاصطناعي لصنع الفيديوهات.
وقالت "غوغل" إن نموذج Veo3 الجديد جاء أكثر تطورا بكثير مقارنة بنموذج Veo2، "فهو لا ينشئ مقاطع الصور فحسب، بل يدعم هذه المقاطع بمؤثرات صوتية مميزة".
وبيّنت أنه يمكن لخوارزميات هذا النموذج إنشاء مؤثرات صوتية وضوضاء خلفية وحتى حوارات ومزامنتها مع الصور.
وما يميز النموذج الجديد، وفق مؤتمر "غوغل"، هو قدرته على تحليل الصور بشكل دقيق ومزامنتها مع الأصوات للحصول على مقاطع فيديو عالية الجودة.
ولم تعلن غوغل عن المصادر التي استخدمتها في تدريب Veo3، لكن التسريبات تشير إلى أنها اعتمدت على فيديوهات يوتيوب.
وكان قسم DeepMind التابع لـ "غوغل"، قد أشار سابقا إلى احتمالية الاستفادة من محتوى يوتيوب لتدريب الذكاء الاصطناعي.
ولمواجهة تقنيات "التزييف العميق" ستحصل مقاطع الفيديو المولدة بنموذج Veo3 على علامات مائية خاصة.
وتستخدم غوغل تقنية SynthID التي تدمج علامات غير مرئية في كل إطار من إطارات الفيديو، وبالتالي سيكون بالإمكان معرفة أن المقطع تم توليده بالذكاء الاصطناعي.
ويتوفر النموذج الجديد ضمن تطبيق Gemini لمستخدمي باقات AI Ultra التي تكلّف اشتراكاتها 250 دولارا شهريا.