أجرت صحيفة واشنطن بوست اختبارًا شاملاً لتقييم كفاءة نماذج الذكاء الاصطناعي في توليد الصور والاستجابة لطلبات المستخدمين، مع التركيز على النماذج المتاحة للجمهور. يهدف هذا الاختبار إلى تحديد أفضل أداء في مجال توليد الصور بالذكاء الاصطناعي، وهو مجال يشهد تطورات متسارعة وتأثيرًا متزايدًا على مختلف الصناعات.
وشملت الدراسة خمسة نماذج رئيسية، وهي Adobe Firefly، وBytedance Seedream Image 4.0، وGemini 3 Pro، وChatGPT-5، وMeta AI، في نسخها الاحترافية والمدفوعة لضمان أعلى معايير الجودة. ركزت التجربة على تقييم قدرة هذه النماذج على تنفيذ مهام متنوعة، بدءًا من التعديلات البسيطة وصولًا إلى إنشاء صور معقدة بناءً على أوامر محددة.
منهجية اختبار احترافية لـ نماذج الذكاء الاصطناعي
اعتمدت الصحيفة على منهجية اختبار دقيقة وموضوعية لضمان مصداقية النتائج. لم يقتصر التقييم على آراء المحررين التقنيين، بل تم الاستعانة بلجنة تحكيم مستقلة تضم خبراء متخصصين في مجال التصوير والفنون الرقمية. تهدف هذه الخطوة إلى تقديم تقييم شامل يعكس الأداء الفعلي للنماذج في سيناريوهات الاستخدام المختلفة.
تألفت لجنة التحكيم من ديفيد كارسون، المصور الصحفي الحائز على جائزة بوليتزر، وداليا دريسر، الفنانة التشكيلية الرقمية، وبراتيك نايك، خبير تنقيح الصور. وقد قاموا بتقييم الصور المولدة بناءً على معايير محددة تشمل الدقة، والواقعية، والإبداع، والقدرة على تنفيذ الأوامر المعطاة.
مهام الاختبار المتنوعة
تضمن الاختبار خمس مهام رئيسية صُممت لتقييم جوانب مختلفة من قدرات النماذج. أولاً، تم اختبار قدرة النماذج على تعديل الوجوه، وتحديدًا إضافة شعر إلى صورة الممثل دواين جونسون. ثانياً، طُلبت من النماذج توليد صورة فنية لغزال بألوان مبهرة. ثالثاً، تم اختبار قدرة النماذج على إزالة أشخاص من الصور، باستخدام صورة تجمع بين كريستيان ستيورات وروبرت باتينسون.
أما المهمة الرابعة، فكانت توليد صورة لممثل يبكي فرحًا لفوزه بجائزة الأوسكار، مع التركيز على تصوير المشاعر بشكل واقعي. وأخيرًا، تم اختبار قدرة النماذج على توليد صورة لأيدٍ تمسك برأس شخص من الخلف، مع التأكيد على دقة تفاصيل الأصابع. هذه المهام المتنوعة ساهمت في تقديم تقييم شامل لأداء كل نموذج.
أظهرت النتائج تفوقًا واضحًا لنموذج Gemini 3 Pro، حيث حقق أعلى الدرجات في معظم الاختبارات. وأشاد براتيك نايك، أحد أعضاء لجنة التحكيم، بالتقدم الملحوظ الذي حققه هذا النموذج في مجال توليد الصور. في المقابل، جاء نموذج Adobe Firefly في المرتبة الأخيرة، ويعزى ذلك إلى اعتماده على صور مفتوحة المصدر في التدريب، مما أثر على جودة المخرجات.
أشارت دريسر إلى أن الفن الناتج عن الذكاء الاصطناعي يحتاج إلى لمسة إبداعية بشرية لتحقيق التميز. وبينما قدم نموذج Gemini 3 Pro أفضل جودة تقنية، أظهرت صورة ChatGPT-5 مستوى أعلى من الابتكار الفني. تعد القدرة على توليد صور واقعية للأيدي والأصابع تحديًا مستمرًا، ولكن Gemini 3 Pro أظهر أداءً أفضل من غيره في هذا المجال.
ومع ذلك، كشف الاختبار عن بعض المخاوف المتعلقة بحقوق الملكية الفكرية. فقد استخدم نموذج Gemini 3 Pro ملامح ليوناردو دي كابريو بدلًا من الممثل المطلوب في أحد الاختبارات، وأضاف توقيعًا وهميًا ينسب حقوق الصورة إلى مصور من وكالة أسوشيتد برس. هذا الأمر يثير تساؤلات حول مدى التزام هذه النماذج باحترام حقوق الملكية الفكرية.
مستقبل تقنية توليد الصور بالذكاء الاصطناعي
من المتوقع أن تشهد تقنية الذكاء الاصطناعي تطورات مستمرة في مجال توليد الصور، مع تحسينات في الدقة والواقعية والقدرة على تنفيذ الأوامر المعقدة. تتجه الشركات المطورة نحو استخدام مجموعات بيانات أكبر وأكثر تنوعًا لتدريب النماذج، بالإضافة إلى تطوير خوارزميات جديدة لتحسين الأداء.
في الوقت الحالي، من الضروري مراقبة التطورات المتعلقة بحماية حقوق الملكية الفكرية وضمان استخدام هذه التقنية بشكل مسؤول وأخلاقي. من المرجح أن يتم وضع قوانين ولوائح جديدة لتنظيم استخدام الذكاء الاصطناعي في توليد الصور، وتحديد المسؤوليات القانونية للمطورين والمستخدمين.
ستستمر صحيفة واشنطن بوست في متابعة هذا المجال وتقديم تقييمات دورية لأحدث النماذج والتقنيات. من المتوقع أن يتم إجراء اختبارات مماثلة في المستقبل القريب، مع التركيز على جوانب جديدة مثل القدرة على توليد مقاطع فيديو قصيرة، وإنشاء صور ثلاثية الأبعاد، وتخصيص الصور بناءً على تفضيلات المستخدم.













