ماهي أفضل أداة لصناعة الفيديو بالذكاء الاصطناعي مقارنة بين Sora وGrok وVeo 3


لم يعد الذكاء الاصطناعي مقتصرًا على توليد الصور أو المحادثات النصية، بل أصبح قادرًا على إنتاج مقاطع فيديو واقعية يمكن توظيفها في التسويق والإعلانات أو حتى المحتوى الإبداعي، ومع تنوع الأدوات المتاحة، قرر أحد الباحثين المتخصصين إخضاع أبرز المنصات لاختبار عملي واحد، عبر تزويدها جميعًا بنفس السيناريو، ومقارنة النتائج لمعرفة أي أداة تقدم الفيديو الأقرب إلى الاحترافية، وفقا لـ digitaltrends
سيناريو التجربة
تم تقديم نفس التعليمات لكل أداة: رجل يجلس أمام حاسبه المحمول داخل مكتب، وخلفه بعض الأشخاص. ينظر أولًا إلى جهازه بتركيز وفي أجواء مشحونة، ثم يرفع رأسه إلى الكاميرا، يبتسم ويلوح بيده.
وقد اختير هذا السيناريو تحديدًا لاختبار قدرة الذكاء الاصطناعي على إنتاج بشر واقعيين، التلاعب بالعمق البصري بين المقدمة والخلفية، والتعامل مع تفاصيل معقدة مثل حركة الأصابع، وهي من أصعب التحديات أمام تقنيات توليد الفيديو.
النتائج بالترتيب
المركز الثالث: Sora (من OpenAI ومايكروسوفت Copilot)
رغم أن الفيديو الناتج من Sora بدا بجودة عالية جدًا من حيث وضوح الصورة والعمق البصري، إلا أنه فشل في تنفيذ جوهر المطلوب. الشخصية لم تقم بالحركة المطلوبة، ولم يظهر تفاعلها مع الحاسوب بشكل طبيعي، إذ بدا وكأنها تحدق في الفراغ بدلًا من الشاشة. وبذلك لم يلتزم الفيديو بالسيناريو الأساسي، وهو ما يعد إخفاقًا كبيرًا رغم أن الخدمة لا تتاح إلا عبر اشتراك مدفوع يبلغ 19.99 دولار شهريًا.
المركز الثاني: Grok (الأداة المجانية)
ميزة Grok الرئيسية أنها الأداة الوحيدة التي يمكن استخدامها دون رسوم. الفيديو الذي أنتجته التزم إلى حد كبير بالسيناريو المطلوب: البيئة المكتبية واضحة، الشخصية نظرت إلى الكاميرا ولوّحت بيدها بالفعل. ورغم ظهور بعض العيوب مثل اهتزاز بسيط في حركة الأصابع وملمس صناعي واضح بفعل فلتر تنعيم، فإن Grok نجحت في تقديم فيديو أقرب للمطلوب من Sora، وبشكل مجاني.
المركز الأول: Veo 3 (Google Gemini)
تفوقت منصة Veo 3 المدعومة من Google Gemini بوضوح. الفيديو الذي أنتجته جاء بجودة فائقة: خلفية غير واضحة التفاصيل لكن طبيعية، الشخصية في بؤرة التركيز، وأجواء متوترة في البداية تتحول إلى مريحة مع ابتسامة واقعية. الأهم أن حركة اليدين والأصابع بدت طبيعية تمامًا بلا تشوهات أو أخطاء، ما جعل الفيديو يبدو صالحًا للبث في إعلان تجاري حقيقي. ورغم أن الخدمة مدفوعة باشتراك شهري قدره 19.99 دولار (مع فترة تجريبية مجانية لشهر واحد)، فإنها أثبتت أنها الأداة الأكثر دقة وإقناعًا.
أيهما الأفضل؟
أظهرت التجربة أن أدوات الذكاء الاصطناعي لإنتاج الفيديو لا تزال متفاوتة في قدراتها: Veo 3 من Google احتلت الصدارة بفضل الدقة والواقعية، Grok أثبتت أن المجانية قد تمنح نتائج معقولة، بينما جاءت Sora مخيبة للآمال رغم جودة الصورة العالية وكلفة الاشتراك المرتفعة، النتيجة تكشف أن السباق ما زال مفتوحًا، لكن حتى الآن يبدو أن الكلمة العليا تعود لجوجل.
.