تعمل جوجل بقوة على الترويج للذكاء الاصطناعي التوليدي على مدار الـ 18 شهرًا الماضية أو نحو ذلك، وكانت ميزة Magic Editor واحدة من أبرز العروض التوضيحية لهذه التقنية. الآن، يبدو أن ميزة الصور الكبيرة التالية المدعومة بالذكاء الاصطناعي للشركة قد تكون RealFill.
قدمت جوجل بهدوء علامة تجارية لما يسمى بتقنية RealFill الأسبوع الماضي. تم تقديم العلامة التجارية هذه لمكتب الاتحاد الأوروبي للملكية الفكرية (EUIPO) ومكتب براءات الاختراع والتجارة الأمريكي (USPTO). ويقول الوصف الموجز للعلامة التجارية : “ توفير برامج غير قابلة للتحميل بإستخدام الذكاء الاصطناعي لرسم الصور، توفير برامج غير قابلة للتحميل عبر الإنترنت لإنشاء نماذج توليدية “.
شرح تقنية RealFill
اتضح أنه تم الكشف الغطاء عن تقنية RealFill بالفعل في أواخر العام الماضي في ورقة بحثية وموقع إلكتروني أعدها فريق من الباحثين من جوجل وجامعة كورنيل. تصف الورقة التي تحمل عنوان ” الجيل المبني على المراجع لإستكمال الصورة الأصلية ” طريقة لتوسيع الصور ورسمها بشكل أكثر دقة.
وبشكل أكثر تحديدًا، تستطيع تقنية RealFill توسيع صورة موجودة فعلاً ورسمها بشكل أكثر دقة بإستخدام ما يصل إلى خمس صور كمرجع:
ليس من الضروري أن تتماشى هذه الصور المرجعية مع الصورة المستهدفة، ويمكن إلتقاطها من زوايا مختلفة، أو في ظروف إضاءة مختلفة، أو بإستخدام إعدادات مختلفة للكاميرا، أو بإستخدام أنماط تصوير مختلفة.
يقوم الفريق أولاً بضبط نموذج الذكاء الاصطناعي التوليدي المستخدم على الصور المرجعية والمستهدفة. تسمح هذه العملية للنموذج بمعرفة الإضاءة والنمط ومحتويات المشهد في الصور. ومع ذلك، فإن النتائج تتحدث عن نفسها، كما هو موضح في الصور أدناه. توضح الصور أدناه أيضًا كيفية مقارنة صور RealFill بالحلول الأخرى، مثل Stable Diffusion.


وعلى ذكر ذلك، لاحظ الفريق بعض القيود مع RealFill. أحد الجوانب السلبية الملحوظة هو أنها تحتاج إلى الخضوع ” لعملية ضبط دقيقة قائمة على التدرج ” على الصور المدخلة، مما يجعل العملية بطيئة. قد يكون من الصعب أيضًا إستعادة المشهد في الصورة النهائية إذا كان هناك فرق كبير بين الصور المرجعية والصورة المستهدفة. وعلاوة على ذلك، وجد الباحثون أن النصوص قد تمثل مشكلة عند إستخدام هذه التقنية.
له سنرى هذه التقنية في Google Pixel 9 أو Google Photos؟
براءات الاختراع أو العلامات التجارية المسجلة لا تضمن أن RealFill ستكون متاحة تجاريًا. ومع ذلك، فمن المنطقي أن تأتي إلى سلسلة هواتف Google Pixel أو Google Photos في المستقبل إذا كان من المقرر بالفعل إصدارها تجاريًا.
نحن نعتقد أن هذه ستكون على الأرجح ميزة قائمة على السحابة بدلاً من خيار تحرير الصور على الجهاز، خاصة وأن الفريق لاحظ أن عملية الضبط الدقيق بطيئة.
إن الحلول الحالية لتوسيع الصور والرسم الداخلي بعيدة كل البعد عن الكمال، لذا فإن الحل الذي يستخدم الصور المرجعية لا يزال من الممكن أن يحقق نتائج أفضل بكثير. ويعني هذا أيضًا أن المستخدمين يمكنهم نظريًا العودة إلى اللقطات القديمة في مكتبة Google Photos الخاصة بهم وإنشاء صور أفضل.
وفي كلتا الحالتين، من المرجح أن تثير هذه الميزة المزيد من الأسئلة حول تعريف الصورة، مثلما أثار المحرر Google Magic Editor جدلاً حول هذا الموضوع.