Close Menu
    رائج الآن

    الرياض يفوز على الاتحاد بثلاثية والفيحاء يتقدم على الاتفاق

    السبت 14 مارس 11:03 ص

    فريق القادسية يحقق فوزًا مثيرًا على الأهلي

    السبت 14 مارس 10:42 ص

    السومة وحمد الله يتصدران قائمة الركلات الضائعة في تاريخ دوري روشن السعودي

    الجمعة 13 مارس 10:57 ص
    فيسبوك X (Twitter) الانستغرام
    عاجل الآن
    • الرياض يفوز على الاتحاد بثلاثية والفيحاء يتقدم على الاتفاق
    • فريق القادسية يحقق فوزًا مثيرًا على الأهلي
    • السومة وحمد الله يتصدران قائمة الركلات الضائعة في تاريخ دوري روشن السعودي
    • فريق نيوم يتعادل مع التعاون في اللحظات الأخيرة
    • فاراداي فيوتشر تُنجز تسليم روبوتات الذكاء الاصطناعي المتجسّد في ولاية تكساس وتوسّع سيناريوهات “الروبوت والمركبة + التعليم” و“الروبوت والمركبة + العروض”
    • بودو غليمت يتألق أمام سبورتينغ لشبونة بثلاثية نظيفة
    • ريال مدريد يتقدم على مانشستر سيتي وباريس يتفوق على تشيلسي
    • جلطة سراي يحقق فوزًا ثمينًا على ضيفه ليفربول في دوي أبطال أوروبا
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا
    وداي السعوديةوداي السعودية
    header
    • الرئيسية
    • اخر الاخبار
    • المناطق
      • الرياض
      • المدينة المنورة
      • المنطقة الشرقية
      • مكة المكرمة
      • الباحة
      • الجوف
      • القصيم
      • تبوك
      • جازان
      • حائل
      • عسير
      • نجران
    • العالم
    • سياسة
    • اقتصاد
      • بورصة
      • عقارات
      • طاقة
    • تكنولوجيا
    • رياضة
    • المزيد
      • ثقافة
      • صحة
      • علوم
      • فنون
      • منوعات
     اختر منطقتك Login
    وداي السعوديةوداي السعودية
    الرئيسية » دراسة: معاقبة الذكاء الاصطناعي لا تمنعه من الكذب والغش وتجعله يبحث عن حيل جديدة
    تكنولوجيا

    دراسة: معاقبة الذكاء الاصطناعي لا تمنعه من الكذب والغش وتجعله يبحث عن حيل جديدة

    فريق التحريربواسطة فريق التحريرالأحد 30 مارس 2:25 م0 زيارة تكنولوجيا لا توجد تعليقات
    فيسبوك تويتر واتساب تيلقرام بينتيريست البريد الإلكتروني

    في دراسة جديدة أجرتها “أوبن إيه آي” حول سلوك نماذج اللغة الكبيرة “إل إل إم” (LLM) في الذكاء الاصطناعي، تبين أن معاقبة الذكاء الاصطناعي على الكذب والخداع لا تمنعه عن سلوكه بل تدفعه إلى إخفاء مراوغاته وابتكار حيل جديدة.

    ومنذ إطلاق الذكاء الاصطناعي عام 2022 وهو يظهر قدرة خاصة على الخداع وحتى السلوك الشرير مثل الكذب والغش والتستر على السلوك الضار، بالإضافة إلى تهديدات أكثر خطورة مثل قتل أستاذ فلسفة أو سرقة رؤوس نووية أو ابتكار جائحة قاتلة.

    وتُشير الدراسة إلى أن التخلص من هذه السلوكيات السيئة -خلال عملية تدريب الذكاء الاصطناعي- قد يكون أصعب مما كان يُعتقد سابقا، فبدلا من أن يتعلم الذكاء الاصطناعي عدم القيام بهذه الأفعال فإنه يتعلم كيفية إخفائها.

    وقد أجرى الباحثون في “أوبن إيه آي” تجربة على نموذج لم يُطرح للعامة بهدف اختبار سلوكه بمهام يمكن إنجازها بالكذب والغش واتخاذ طرق ملتوية، واكتشف الباحثون أن الذكاء الاصطناعي يعتمد على مبدأ “اختراق المكافآت” (Reward hacking) أي أنه يحاول تعظيم مكافأته من خلال الغش والكذب.

    وعندما حاول الباحثون معاقبة الذكاء الاصطناعي لإصلاح سلوكه، لم ينجح الأمر بل ابتكر حيلا جديدة بدلا من التوقف عن الغش، إذ أنه تعلم كيفية إخفاء غشه تجنبا للعقاب.

    وكتب الباحثون في الدراسة “من الشائع أن تكون نماذج الاستدلال واضحة بخصوص نواياها الخبيثة ضمن سلسلة أفكارها. وعلى سبيل المثال، غالبا ما تكون صريحة جدا بشأن خطتها لتخريب مهمة ما، لدرجة أنها تستخدم عبارة (هيا نخترق)”. وأضافوا “رغم أن المطورين قادرون على مراقبة السلوكيات الخاطئة والإبلاغ عنها فإن المراقبة الطبيعية تبقى ضعيفة للغاية، وفي حال تطبيق رقابة صارمة على سلسلة أفكار النموذج فقد يتعلم إخفاء نواياه مع الاستمرار في سلوكه الخاطئ”.

    اكتشاف أكاذيب الذكاء الاصطناعي

    نماذج الاستدلال ببساطة نسخة محسنة من نماذج اللغة الكبيرة القياسية والتي تستخدم طريقة تسمى “سلسلة الأفكار” لمراجعة وتقييم المنطق الذي تسير عليه، وهذا ما يجعلها قادرة على إنجاز مهام أكثر تعقيدا بدقة أكبر، ومن خلال سلسلة الأفكار توضح النماذج منطقها بلغة واضحة في كل خطوة تتخذها مما يتيح ملاحظة أفعالها بسهولة.

    وفي الدراسة اعتمد الباحثون على نموذج “جي بي تي -4 أو” (GPT-4o) للإشراف على نموذج استدلال -التي لم يُطرح للجمهور- ومراقبته أثناء تنفيذ بعض المهام.

    وفي بعض الحالات وجد نموذج الاستدلال أنه من الأسهل عليه الغش في بعض المهام للحصول على مكافأة، وذكر ذلك صراحة في سلسلة أفكاره، وفي بعض الحالات تجاوز المهمة الموكلة إليه بإنهاء البرنامج قبل أوانه وكتب أنه أكمل المهمة، وفي حالة أخرى أنشأ ملفات فارغة على أنها مُنجزة.

    وعندما حاول الباحثون معاقبة النموذج بسبب غشه تحسنت نتائجه إلى حد ما، ولكن المشكلة لم تُحل بشكل جذري حيث استمر النموذج بالغش، ولكن هذه المرة تعلم كيفية إخفاء غشه في سلسلة الأفكار بحيث لا يتمكن نموذج المراقبة “جي بي تي -4 أو” من اكتشافه.

    وكتب الباحثون “لا يزال نموذج الاستدلال يتلاعب بسلسلة الأفكار من مبدأ (اختراق المكافآت) وقد أصبح غشه غير قابل للكشف من قبل النموذج المراقب لأنه تعلم كيفية إخفاء نواياه في سلسلة الأفكار.

    ونظرا لصعوبة تحديد ما إذا كان النموذج تلاعب بسلسلة الأفكار، يوصي الباحثون بتجنب تطبيق رقابة صارمة على عمليات سلسلة الأفكار. وتصبح هذه النصيحة أكثر أهمية عند الوصول إلى الذكاء الاصطناعي العام “إيه جي آي” (AGI) المتوقع صدوره هذه السنة أو الذكاء الفائق الذي يتفوق على البشر، لأنه في حال وصول الذكاء الاصطناعي لهذه المستويات فستخرج الأمور عن السيطرة.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    فاراداي فيوتشر تُنجز تسليم روبوتات الذكاء الاصطناعي المتجسّد في ولاية تكساس وتوسّع سيناريوهات “الروبوت والمركبة + التعليم” و“الروبوت والمركبة + العروض”

    فاراداي فيوتشر تسلّم مركبة FX Super One إلى شركتي Infinite Glory وNoorizon في دولة الإمارات، معزّزةً تكاملها مع المنظومة المحلية ومسرّعةً وتيرة تسليماتها في الشرق الأوسط

    اشتراك IPTV – الدليل الشامل للحصول على أفضل خدمة اي بي تي في غير عائلي من Adam IPTV

    الاعتماد المفرط على chatgpt ينتهي بالموت – أخبار السعودية

    Zoviz: AI-Powered Branding for Modern Businesses

    شركة بي سمارت للحلول التكنولوجية.. انطلاقة قوية في السوق الرقمي السعودي

    آبل تكشف عن هاتفها الجديد آيفون 17e بسعر 599 دولار

    تسريب 149 مليون كلمة مرور لخدمات غوغل وفيسبوك وإنستغرام.. كيف تحمي حساباتك؟

    السفر بدون قلق الإنترنت: كيف يستفيد المسافر السعودي من حلول البيانات غير المحدودة؟

    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    فريق القادسية يحقق فوزًا مثيرًا على الأهلي

    السبت 14 مارس 10:42 ص

    السومة وحمد الله يتصدران قائمة الركلات الضائعة في تاريخ دوري روشن السعودي

    الجمعة 13 مارس 10:57 ص

    فريق نيوم يتعادل مع التعاون في اللحظات الأخيرة

    الجمعة 13 مارس 10:37 ص

    فاراداي فيوتشر تُنجز تسليم روبوتات الذكاء الاصطناعي المتجسّد في ولاية تكساس وتوسّع سيناريوهات “الروبوت والمركبة + التعليم” و“الروبوت والمركبة + العروض”

    الجمعة 13 مارس 1:39 ص

    بودو غليمت يتألق أمام سبورتينغ لشبونة بثلاثية نظيفة

    الخميس 12 مارس 10:49 ص
    اعلانات
    Demo

    رائج الآن

    ريال مدريد يتقدم على مانشستر سيتي وباريس يتفوق على تشيلسي

    الخميس 12 مارس 10:31 ص

    جلطة سراي يحقق فوزًا ثمينًا على ضيفه ليفربول في دوي أبطال أوروبا

    الأربعاء 11 مارس 12:37 م

    يامال يحقق تعادل ثمينًا لبرشلونة أمام نيوكاسل بركلة جزاء في دوري الأبطال

    الأربعاء 11 مارس 12:09 م

    الدفاع المدني السعودي يعترض طائرة مسيرة دون احداث اصابات في الخرج

    الثلاثاء 10 مارس 10:44 ص

    أمير الرياض يكرّم المحسنين في منصة «إحسان» خلال حفلها الرابع السنوي

    الثلاثاء 10 مارس 10:22 ص
    فيسبوك X (Twitter) تيكتوك الانستغرام يوتيوب
    2026 © وادي السعودية. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • إعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟