أعلنت شركة Kuaishou Technology الصينية عن ابتكارها الجديد Kling، وهو نموذج ذكاء اصطناعي متطور يحول النص إلى فيديو عالي الجودة. يتميز Kling بقدرته على إنتاج مقاطع فيديو تصل مدتها إلى دقيقتين بدقة 1080 بكسل، متفوقًا بذلك على منافسه Sora من شركة OpenAI الذي يقوم بإنشاء مقاطع فيديو مدتها دقيقة واحدة فقط.
يستخدم Kling معمارية Diffusion Transformer المتطورة، بالإضافة إلى تكنولوجيا 3D VAE لإنتاج ملامح الوجه والحركات المتقدمة الخاصة بالشركة، لإنشاء حركات واقعية تحاكي العالم المادي بدقة عالية. يتيح هذا للنموذج تحويل الأوصاف النصية إلى صور وفيديوهات نابضة بالحياة، مع إمكانية تخصيص نسبة العرض إلى الارتفاع.
أظهرت مقاطع الفيديو التجريبية التي نشرتها الشركة قدرة Kling على إنتاج مقاطع فيديو عالية الجودة تحاكي الخصائص الفيزيائية للعالم الحقيقي بدقة مذهلة. يُعد هذا إنجازًا كبيرًا في مجال الذكاء الاصطناعي، حيث يفتح الباب أمام إمكانيات جديدة في صناعة المحتوى والإبداع.
يأتي Kling لينضم إلى قائمة النماذج الصينية المتطورة في مجال تحويل النص إلى فيديو، مثل Vidu AI الذي تم إصداره في أبريل الماضي، على الرغم من حقيقة أن هذا الأخير قادر فقط على إنتاج مقاطع فيديو مدتها 16 ثانية بدقة 1080 بكسل. ومع ذلك، هذا التطور السريع في الصين يعكس إلتزام هذه الأخيرة بتحقيق الريادة في مجال الذكاء الاصطناعي وتطبيقاته المتنوعة.
مع إطلاق Kling، يمكننا أن نتوقع رؤية المزيد من التطبيقات الإبداعية للذكاء الاصطناعي في صناعة المحتوى المرئي. قد يؤدي هذا إلى تغيير جذري في طريقة إنتاج الفيديوهات وتوزيعها، مما يوفر فرصًا جديدة للمبدعين والشركات على حد سواء.