في تطور لافت يشهد تسارعًا في مجال التكنولوجيا، كشفت صحيفة واشنطن بوست نتائج اختبارات مكثفة لتقييم أداء نماذج الذكاء الاصطناعي في توليد وتعديل الصور بالذكاء الاصطناعي. أظهرت الاختبارات قدرات متزايدة لهذه النماذج، مما يضع مستقبل الإبداع البصري في متناول المستخدمين بشكل أسرع من المتوقع. شملت الاختبارات خمسة نماذج رائدة متاحة للجمهور وهي: Adobe Firefly، و Bytedance Seedream Image 4.0، و Gemini 3 Pro، و ChatGPT-5، و Meta AI.
أجريت الاختبارات في ديسمبر 2023 واستمرت عدة أسابيع، وقيّمت قدرة النماذج على إنجاز مهام معقدة تتجاوز التعديلات البسيطة. تضمنت هذه المهام تغيير ملامح الوجوه، وإزالة أشخاص من الصور، وتوليد تعابير وجه دقيقة تعكس مشاعر معينة، بالإضافة إلى تحدي صعب يتمثل في رسم صور لأيدٍ في أوضاع معقدة. تهدف هذه الاختبارات إلى فهم حدود وإمكانيات الذكاء الاصطناعي في مجال التصوير الرقمي.
تفوق Gemini 3 Pro في توليد الصور بالذكاء الاصطناعي
أظهر نموذج Gemini 3 Pro، من تطوير جوجل، أداءً متميزًا في معظم الاختبارات، متفوقًا على منافسيه بدقة عالية في تعديل الصور وإضافة التفاصيل الدقيقة. تمكن النموذج من إزالة شخصية روبرت باتينسون من صورة مع كريستيان ستيورات وإعادة بناء المشهد بشكل مقنع للغاية، لدرجة يصعب معها التفريق بين الصورة الأصلية والمعدلة.
بالإضافة إلى ذلك، أثبت Gemini 3 Pro قدرته على تعديل ملامح الوجه، وإضافة الشعر، وتصوير عدد الأصابع بدقة غير مسبوقة. أشاد خبراء التصوير والفن الرقمي المشاركون في تقييم الأداء بهذه القدرات، واصفين إياها بأنها قفزة نوعية في مجال الذكاء الاصطناعي.
ومع ذلك، أثار النموذج جدلاً بسيطًا عندما قام بتوليد صورة لشخصية فنية حائزة على جائزة أوسكار، حيث أضاف توقيعًا وهميًا لمصور فوتوغرافي حقيقي، مما أثار تساؤلات حول حقوق الملكية الفكرية. هذا الخطأ سلط الضوء على التحديات الأخلاقية والقانونية المرتبطة بتوليد الصور باستخدام الذكاء الاصطناعي.
أداء النماذج الأخرى
في المقابل، احتل نموذج Adobe Firefly المرتبة الأخيرة في التقييم. يعزى هذا الأداء إلى اعتماد Firefly على الصور المتاحة تحت رخصة المصادر المفتوحة فقط، مما حد من قدرته على إنتاج صور واقعية ودقيقة مقارنة بالنماذج الأخرى التي تستخدم مجموعات بيانات أوسع.
أما نموذج ChatGPT-5 فقد تميز بابتكاره وإبداعه في توليد الصور، على الرغم من بعض الأخطاء الطفيفة في تصوير الأيدي والوجوه. بينما قدم نموذج Bytedance Seedream Image 4.0 أداءً جيدًا، إلا أنه لم يصل إلى مستوى الدقة والواقعية التي أظهرها Gemini 3 Pro. أخيرًا، قدم نموذج Meta AI نتائج متوازنة، مع نقاط قوة وضعف في مختلف جوانب الاختبار.
أكدت لجنة التحكيم، التي ضمت المصور الصحفي الحائز على جائزة بوليتزر ديفيد كارسون، والفنانة الرقمية داليا دريسر، وخبير تعديل الصور براتيك نايك، على الجودة التقنية العالية لصور Gemini 3 Pro. في الوقت نفسه، أشادوا بقدرات ChatGPT-5 الإبداعية، مع الاعتراف بوجود بعض أوجه القصور في الواقعية.
تشير النتائج إلى أن الذكاء الاصطناعي التوليدي لم يعد مقتصرًا على الابتكار الرقمي المجرد، بل أصبح قادرًا على إنتاج صور واقعية للغاية. ومع ذلك، لا تزال هناك تحديات قائمة، خاصة فيما يتعلق بحقوق الملكية الفكرية والدقة الكاملة في تصوير التفاصيل المعقدة مثل الأيدي.
تتزايد أهمية هذه التكنولوجيا في مجالات متعددة مثل التسويق والإعلان، وصناعة الأفلام، والتصميم الجرافيكي، وحتى في التعليم والبحث العلمي. تتيح هذه النماذج للمستخدمين إنشاء صور مخصصة بسرعة وسهولة، مما يوفر الوقت والجهد والموارد.
من المتوقع أن تشهد هذه النماذج تطورات مستمرة في الأشهر والسنوات القادمة، مع تحسينات في الدقة والواقعية والإبداع. كما من المرجح أن تظهر نماذج جديدة أكثر تطوراً، مما يزيد من المنافسة في هذا المجال. يجب مراقبة التطورات التنظيمية والقانونية المتعلقة بحقوق الملكية الفكرية والمسؤولية عن المحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي، حيث من المتوقع أن يتم وضع قوانين جديدة لتنظيم هذا المجال في المستقبل القريب.













