أعلنت شركة OpenAI اليوم عن نموذج الذكاء الإصطناعي الأحدث لها والذي أطلقت عليه إسم Sora، وهو الذكاء الإصطناعي الذي يُسخر قوة النص لإنشاء مقاطع الفيديو. نموذج الذكاء الاصطناعي هذا من الشركة التي تقف وراء روبوت الدردشة التوليدي ChatGPT قادر على إنشاء مقاطع فيديو بدقة عالية وبأبعاد مختلفة ويمكنه أيضًا تحرير مقاطع الفيديو الحالية مما يسمح بإجراء تغييرات سريعة على المشهد والإضاءة وأسلوب التصوير، كل ذلك بإستخدام إستعلام نصي فقط. يمكن لـ Sora أيضًا إنشاء مقاطع فيديو إستنادًا إلى صورة ثابتة أو حتى توسيع مقاطع الفيديو الحالية عن طريق ملء الإطارات المفقودة.
تشير شركة OpenAI إلى أن Sora قادر حاليًا على إنشاء فيديوهات عالية الدقة تصل إلى دقيقة واحدة والأمثلة التي رأيناها تبدو واعدة جدًا. يمكنك زيادة الموقع الرسمي لـ Sora للحصول على المزيد من الفيديوهات التي تم إنشاؤها بواسطة هذا الذكاء الإصطناعي.
يمكن لـ Sora إنشاء مشاهد معقدة بشخصيات متعددة وأنواع محددة من الحركة وتفاصيل دقيقة للموضوع والخلفية. لا يفهم النموذج ما يقصده المستخدم في طلبه فحسب، بل يفهم أيضًا كيفية تواجد هذه الأشياء في العالم الواقعي.
هذا النموذج يعمل بإستخدام هندسة تحويلية ( Transformer Architecture ) مشابهة لتلك المستخدمة في ChatGPT حيث يتم عرض مقاطع الفيديو والصور كوحدات أصغر من البيانات تسمى التصحيحات. تبدأ مقاطع الفيديو التي تم إنشاؤها بواسطة Sora كضوضاء ثابتة مع قيام النموذج بإزالة الضوضاء تدريجيًا لتشكيل المنتج النهائي.
أوضحت شركة OpenAI أنها تستفيد من بروتوكولات السلامة الحالية المستخدمة في DALL·E 3. ويتم حاليًا إختبار Sora من قبل ” الفريق الأحمر “، وهو الفريق الذي يتألف من الخبراء الذين يجرون الإختبارات ويقيمون النموذج بحثًا عن المخاطر المحتملة قبل إطلاقه رسميًا.
ستجري شركة OpenAI أيضًا محادثات مع صناع السياسات والفنانين والمعلمين لمعرفة المخاوف المحتملة وحالات الإستخدام لـ Sora. وقبل الختام، نود أن نشير إلى أنه ليس هناك تاريخ إطلاق رسمي محدد في الوقت الحالي.