Close Menu
    رائج الآن

    السعودية تنضم إلى الشراكة العالمية للذكاء الاصطناعي – أخبار السعودية

    الأحد 22 فبراير 4:52 ص

    بعد الضربة الإسرائيلية الدامية في شرق لبنان: حزب الله ينعى 8 من عناصره ويتعهد بـ”المقاومة”

    السبت 21 فبراير 10:51 م

    ليلى وفاطمة تكتبان فصلًا جديدًا لموضة التسعينات – أخبار السعودية

    السبت 21 فبراير 10:26 م
    فيسبوك X (Twitter) الانستغرام
    عاجل الآن
    • السعودية تنضم إلى الشراكة العالمية للذكاء الاصطناعي – أخبار السعودية
    • بعد الضربة الإسرائيلية الدامية في شرق لبنان: حزب الله ينعى 8 من عناصره ويتعهد بـ”المقاومة”
    • ليلى وفاطمة تكتبان فصلًا جديدًا لموضة التسعينات – أخبار السعودية
    • حرب تجارية جديدة.. ترمب يرفع الرسوم إلى 15% مؤقتاً لـ 150 يوماً – أخبار السعودية
    • أهمية تنظيف وصيانة المكيفات بشكل دوري
    • الدقيقة بـ100 يورو.. أندريك يفرض الانضباط في تدريبات ليون (فيديو)
    • يعتبرونه ملاذا أخيرا.. مرضى غزة ينتظرون فتح معبر رفح
    • 24 شركة مدرجة تسجل قاعها التاريخي في أسبوع.. تعرف عليها – أخبار السعودية
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا
    وداي السعوديةوداي السعودية
    header
    • الرئيسية
    • اخر الاخبار
    • المناطق
      • الرياض
      • المدينة المنورة
      • المنطقة الشرقية
      • مكة المكرمة
      • الباحة
      • الجوف
      • القصيم
      • تبوك
      • جازان
      • حائل
      • عسير
      • نجران
    • العالم
    • سياسة
    • اقتصاد
      • بورصة
      • عقارات
      • طاقة
    • تكنولوجيا
    • رياضة
    • المزيد
      • ثقافة
      • صحة
      • علوم
      • فنون
      • منوعات
     اختر منطقتك Login
    وداي السعوديةوداي السعودية
    الرئيسية » غوغل تؤكد: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتعدى 70%
    تكنولوجيا

    غوغل تؤكد: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتعدى 70%

    فريق التحريربواسطة فريق التحريرالسبت 20 ديسمبر 8:21 م1 زيارة تكنولوجيا لا توجد تعليقات
    فيسبوك تويتر واتساب تيلقرام بينتيريست البريد الإلكتروني

    أظهرت دراسة حديثة أجرتها شركة جوجل أن دقة روبوتات الدردشة القائمة على الذكاء الاصطناعي لا تزال أقل من المتوقع، حيث لم تتجاوز 70% في العديد من الحالات. كشفت الدراسة المكثفة عن نقاط ضعف في هذه النماذج اللغوية، مما يثير تساؤلات حول موثوقيتها في التطبيقات العملية المختلفة. النتائج، التي نشرت في تقرير مفصل، تسلط الضوء على التحديات المستمرة في تطوير أنظمة ذكاء اصطناعي قادرة على فهم اللغة البشرية والإجابة عليها بدقة.

    نشرت جوجل نتائج هذه الدراسة في تقرير من 18 صفحة، يوضح بالتفصيل منهجية الاختبار المستخدمة والأسباب الكامنة وراء التقييمات المنخفضة. تأتي هذه الجهود في وقت يشهد فيه الذكاء الاصطناعي التوليدي نموًا سريعًا، مع تطبيقات متزايدة في مجالات متنوعة مثل خدمة العملاء، والتعليم، وإنشاء المحتوى. يهدف البحث إلى فهم أفضل لقدرات وقيود هذه التقنيات، وتوجيه جهود التطوير نحو تحسين الأداء والموثوقية.

    آلية اختبار مكثفة لـالذكاء الاصطناعي

    اعتمدت مختبرات “ديب مايند” التابعة لجوجل على أربعة معايير رئيسية لتقييم أداء نماذج الذكاء الاصطناعي. تضمنت هذه المعايير تقييم القدرة على استرجاع المعرفة الداخلية، وإجراء البحوث على الإنترنت، وفهم المحتوى متعدد الوسائط (مثل الصور)، وتقديم إجابات متسقة مع سياق محدد. تم تصميم هذه المعايير لتقديم تقييم شامل ومتوازن لقدرات النماذج المختلفة.

    أظهرت النتائج تباينًا كبيرًا في الأداء بين النماذج المختلفة. حقق نموذج “جيميناي 3 برو” أفضل نتيجة إجمالية، متجاوزًا نسبة 69%. تبعه “جيميناي 2.5 برو” بنسبة 62%، ثم “جي بي تي 5” بنسبة 61.8%. في المقابل، حقق نموذجا “كلود أوبس 4.5″ و”غروك” نتائج أقل، بنسب 51% و53% على التوالي.

    أداء النماذج في القطاعات المختلفة

    تطرقت الدراسة أيضًا إلى أداء نماذج الذكاء الاصطناعي في قطاعات محددة مثل الموسيقى، والتكنولوجيا، والتاريخ، والعلوم، والرياضة، والسياسة، والترفيه. كشف هذا التحليل عن نقاط قوة وضعف لكل نموذج في مجالات مختلفة، مما يؤكد على أهمية التخصص والتكيف مع الاحتياجات الخاصة لكل تطبيق. على سبيل المثال، أظهرت بعض النماذج تفوقًا في الإجابة على الأسئلة المتعلقة بالتاريخ، بينما أظهرت نماذج أخرى أداءً أفضل في مجال التكنولوجيا.

    أظهرت النتائج أن نموذج “غروك 4 فاست” كان الأقل أداءً في جميع الاختبارات، حيث بلغ متوسط ​​نتيجته 36%، وانخفض إلى 17% في معيار المحتوى متعدد الوسائط و15% في المعيار البارامتري. يشير هذا إلى أن النموذج قد يحتاج إلى مزيد من التطوير لتحسين قدراته في فهم ومعالجة أنواع مختلفة من المعلومات.

    القيود والمخاطر المحتملة للنماذج اللغوية

    تسلط الدراسة الضوء على أن النماذج اللغوية للذكاء الاصطناعي لا تزال عرضة للأخطاء، حتى عندما تبدو الإجابات منطقية. وهذا يثير مخاوف بشأن استخدام هذه النماذج في التطبيقات الحساسة، مثل الرعاية الصحية والتمويل، حيث يمكن أن يكون للأخطاء عواقب وخيمة. تؤكد جوجل على أن الإجابات الخاطئة، حتى بنسبة صغيرة، يمكن أن تتسبب في ضرر كبير في هذه القطاعات.

    بالإضافة إلى ذلك، تشير الدراسة إلى أن النماذج اللغوية قد تعاني من التحيزات، مما يؤدي إلى إجابات غير عادلة أو تمييزية. يتطلب معالجة هذه التحيزات جهودًا مستمرة في جمع البيانات وتدريب النماذج، بالإضافة إلى تطوير أدوات لتقييم واكتشاف التحيزات المحتملة. تعتبر الشفافية والمساءلة من المبادئ الأساسية في تطوير أنظمة ذكاء اصطناعي موثوقة وعادلة.

    تأتي هذه الدراسة في سياق اهتمام متزايد بتقييم أداء وموثوقية نماذج التعلم الآلي. تعتبر مجتمعات مثل “كاغل” (Kaggle) منصات مهمة لتبادل المعرفة والأدوات بين الباحثين والمطورين في هذا المجال. من خلال توفير مصادر مفتوحة وبيانات متاحة، تساهم هذه المجتمعات في تسريع وتيرة الابتكار وتحسين جودة أنظمة الذكاء الاصطناعي.

    من المتوقع أن تستمر جوجل في إجراء المزيد من الأبحاث والدراسات لتقييم وتحسين أداء نماذج الذكاء الاصطناعي الخاصة بها. تخطط الشركة لمشاركة المزيد من البيانات والنتائج مع المجتمع العلمي، بهدف تعزيز التعاون والابتكار في هذا المجال. سيتم التركيز بشكل خاص على تطوير معايير اختبار أكثر دقة وشمولية، ومعالجة التحيزات المحتملة، وتحسين قدرة النماذج على فهم اللغة البشرية والإجابة عليها بشكل موثوق.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    سابقة عسكرية.. الذكاء الاصطناعي في قلب عملية اعتقال مادورو – أخبار السعودية

    «أبل» تشتري تقنية «قراءة الأفكار» من إسرائيل بمليارَي دولار – أخبار السعودية

    فاراداي فيوتشر تطلق سلسلة منتجاتها من الروبوتات في لاس فيغاس خلال معرض NADA السنوي، وتستهدف أن تصبح أول شركة أمريكية تقوم بتسليم روبوتات بشرية ورباعية الأرجل في الوقت نفسه

    هجوم سيبراني يزيّف المواقع ويخدع المستخدمين من داخل المتصفح – أخبار السعودية

    تعرف على أفضل بدائل برنامج فوتوشوب

    استطلاع: تصاعد المخاوف من فقدان الوظائف بسبب الذكاء الاصطناعي

    هل يقرأ موظفو «واتساب» رسائلنا؟

    كيف تعيد “المدارات المنخفضة” صياغة مفهوم وجود الإنترنت؟

    فاراداي فيوتشر تعلن عن تسليم دفعات جديدة من مركبة FX Super One في الشرق الأوسط، مواصلةً تقدمها نحو تحقيق أهداف التسليم الإقليمية لعام 2026

    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    بعد الضربة الإسرائيلية الدامية في شرق لبنان: حزب الله ينعى 8 من عناصره ويتعهد بـ”المقاومة”

    السبت 21 فبراير 10:51 م

    ليلى وفاطمة تكتبان فصلًا جديدًا لموضة التسعينات – أخبار السعودية

    السبت 21 فبراير 10:26 م

    حرب تجارية جديدة.. ترمب يرفع الرسوم إلى 15% مؤقتاً لـ 150 يوماً – أخبار السعودية

    السبت 21 فبراير 10:10 م

    أهمية تنظيف وصيانة المكيفات بشكل دوري

    السبت 21 فبراير 10:08 م

    الدقيقة بـ100 يورو.. أندريك يفرض الانضباط في تدريبات ليون (فيديو)

    السبت 21 فبراير 9:12 م
    اعلانات
    Demo

    رائج الآن

    يعتبرونه ملاذا أخيرا.. مرضى غزة ينتظرون فتح معبر رفح

    السبت 21 فبراير 3:50 م

    24 شركة مدرجة تسجل قاعها التاريخي في أسبوع.. تعرف عليها – أخبار السعودية

    السبت 21 فبراير 3:28 م

    ترمب يُوقّع تعريفة جمركية عالمية 10 % – أخبار السعودية

    السبت 21 فبراير 8:46 ص

    ترمب: الحكم بإلغاء الرسوم الجمركية مخيب للآمال – أخبار السعودية

    السبت 21 فبراير 2:04 ص

    «وقاء» يعتمد اشتراطات مشددة لاستيراد وتداول شتلات البن – أخبار السعودية

    الجمعة 20 فبراير 7:22 م
    فيسبوك X (Twitter) تيكتوك الانستغرام يوتيوب
    2026 © وادي السعودية. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • إعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟