Close Menu
    رائج الآن

    أمريكا – اليابان.. إطلاق خطة لتأمين سلاسل المعادن النادرة – أخبار السعودية

    السبت 21 مارس 8:04 ص

    مانشستر يونايتد يتعادل أمام بورنموث ليحرم من نقطتين ثمينتين

    السبت 21 مارس 7:51 ص

    احتفالات عيد الأم: اختلاف في التاريخ وتوحيد في المعنى

    السبت 21 مارس 7:36 ص
    فيسبوك X (Twitter) الانستغرام
    عاجل الآن
    • أمريكا – اليابان.. إطلاق خطة لتأمين سلاسل المعادن النادرة – أخبار السعودية
    • مانشستر يونايتد يتعادل أمام بورنموث ليحرم من نقطتين ثمينتين
    • احتفالات عيد الأم: اختلاف في التاريخ وتوحيد في المعنى
    • «ضباب جيوسياسي».. كيف أثر صراع الشرق الأوسط على صانعي السياسة النقدية الأمريكية؟ – أخبار السعودية
    • تفاصيل فاجعة صالون نسائي بمدينة الخليل
    • «الجمارك»: تكثيف الإجراءات الاحترازية وتعزيز حماية المرافق والمنشآت الجمركية
    • خطوات بسيطة لتخليص حيوانك الأليف من آلام حساسية الطعام المزمنة
    • رغم مساعي ترمب.. أسعار البنزين تقفز 30% – أخبار السعودية
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا
    وداي السعوديةوداي السعودية
    header
    • الرئيسية
    • اخر الاخبار
    • المناطق
      • الرياض
      • المدينة المنورة
      • المنطقة الشرقية
      • مكة المكرمة
      • الباحة
      • الجوف
      • القصيم
      • تبوك
      • جازان
      • حائل
      • عسير
      • نجران
    • العالم
    • سياسة
    • اقتصاد
      • بورصة
      • عقارات
      • طاقة
    • تكنولوجيا
    • رياضة
    • المزيد
      • ثقافة
      • صحة
      • علوم
      • فنون
      • منوعات
     اختر منطقتك Login
    وداي السعوديةوداي السعودية
    الرئيسية » شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟
    تكنولوجيا

    شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟

    فريق التحريربواسطة فريق التحريرالسبت 20 يوليو 1:33 م1 زيارة تكنولوجيا لا توجد تعليقات
    فيسبوك تويتر واتساب تيلقرام بينتيريست البريد الإلكتروني

    في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.

    لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى “ويسبر” (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.

    في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج “جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.

    مطاردات يائسة

    تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.

    مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.

    وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.

    شريان الحياة للذكاء الاصطناعي

    توضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.

    هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل “شات جي بي تي”، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.

    في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.

    لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.

    لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد “إيبوك” (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.

    بيانات اصطناعية

    أصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات “الاصطناعية”. ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.

    مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.

    وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.

    استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.

    ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    كيف تتعاقد مع أفضل شركة سيو مناسبة لتحسين ظهور موقعك في جوجل؟

    فاراداي فيوتشر تُنجز تسليم روبوتات الذكاء الاصطناعي المتجسّد في ولاية تكساس وتوسّع سيناريوهات “الروبوت والمركبة + التعليم” و“الروبوت والمركبة + العروض”

    فاراداي فيوتشر تسلّم مركبة FX Super One إلى شركتي Infinite Glory وNoorizon في دولة الإمارات، معزّزةً تكاملها مع المنظومة المحلية ومسرّعةً وتيرة تسليماتها في الشرق الأوسط

    اشتراك IPTV – الدليل الشامل للحصول على أفضل خدمة اي بي تي في غير عائلي من Adam IPTV

    الاعتماد المفرط على chatgpt ينتهي بالموت – أخبار السعودية

    Zoviz: AI-Powered Branding for Modern Businesses

    شركة بي سمارت للحلول التكنولوجية.. انطلاقة قوية في السوق الرقمي السعودي

    آبل تكشف عن هاتفها الجديد آيفون 17e بسعر 599 دولار

    تسريب 149 مليون كلمة مرور لخدمات غوغل وفيسبوك وإنستغرام.. كيف تحمي حساباتك؟

    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    مانشستر يونايتد يتعادل أمام بورنموث ليحرم من نقطتين ثمينتين

    السبت 21 مارس 7:51 ص

    احتفالات عيد الأم: اختلاف في التاريخ وتوحيد في المعنى

    السبت 21 مارس 7:36 ص

    «ضباب جيوسياسي».. كيف أثر صراع الشرق الأوسط على صانعي السياسة النقدية الأمريكية؟ – أخبار السعودية

    السبت 21 مارس 1:22 ص

    تفاصيل فاجعة صالون نسائي بمدينة الخليل

    الجمعة 20 مارس 9:07 م

    «الجمارك»: تكثيف الإجراءات الاحترازية وتعزيز حماية المرافق والمنشآت الجمركية

    الجمعة 20 مارس 6:44 م
    اعلانات
    Demo

    رائج الآن

    خطوات بسيطة لتخليص حيوانك الأليف من آلام حساسية الطعام المزمنة

    الجمعة 20 مارس 6:43 م

    رغم مساعي ترمب.. أسعار البنزين تقفز 30% – أخبار السعودية

    الجمعة 20 مارس 6:40 م

    وثيقة تاريخية تكشف تقاليد المراسلات والتهاني في عهد الملك عبدالعزيز – أخبار السعودية

    الجمعة 20 مارس 3:19 م

    مصدر: تحميل النفط من ينبع يسير طبيعياً – أخبار السعودية

    الجمعة 20 مارس 11:58 ص

    الخط الأصفر لا يحمي الغزيين من رصاص إسرائيل

    الجمعة 20 مارس 7:12 ص
    فيسبوك X (Twitter) تيكتوك الانستغرام يوتيوب
    2026 © وادي السعودية. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • إعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟