Close Menu
    رائج الآن

    طيور مهاجرة بدقة “ساعة سويسرية”.. والسر في جهاز وزنه غرام

    الإثنين 22 ديسمبر 2:20 ص

    وفاة الفنانة المصرية سمية الألفي بعد صراع طويل مع السرطان

    الإثنين 22 ديسمبر 1:48 ص

    أفضل مكتب تجنيس وتصريح زواج وتعقيب سعودي في المملكة

    الإثنين 22 ديسمبر 1:27 ص
    فيسبوك X (Twitter) الانستغرام
    عاجل الآن
    • طيور مهاجرة بدقة “ساعة سويسرية”.. والسر في جهاز وزنه غرام
    • وفاة الفنانة المصرية سمية الألفي بعد صراع طويل مع السرطان
    • أفضل مكتب تجنيس وتصريح زواج وتعقيب سعودي في المملكة
    • كتاب جديد: وصفة تشومسكي وموخيكا للنجاة من القرن الـ21
    • نائب وزير الرياضة يتوّج الأمريكي تيين بلقب بطولة الجيل القادم للتنس 2025
    • ترامب يربك واشنطن بشأن فنزويلا.. غزو أم تغيير نظام أم مجرد ضغط؟
    • رغم الجدل.. ويكيبيديا تُبقي توصيف “الإبادة” لأفعال إسرائيل في غزة
    • رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا
    وداي السعوديةوداي السعودية
    header
    • الرئيسية
    • اخر الاخبار
    • المناطق
      • الرياض
      • المدينة المنورة
      • المنطقة الشرقية
      • مكة المكرمة
      • الباحة
      • الجوف
      • القصيم
      • تبوك
      • جازان
      • حائل
      • عسير
      • نجران
    • العالم
    • سياسة
    • اقتصاد
      • بورصة
      • عقارات
      • طاقة
    • تكنولوجيا
    • رياضة
    • المزيد
      • ثقافة
      • صحة
      • علوم
      • فنون
      • منوعات
     اختر منطقتك Login
    وداي السعوديةوداي السعودية
    الرئيسية » شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟
    تكنولوجيا

    شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟

    فريق التحريربواسطة فريق التحريرالسبت 20 يوليو 1:33 م0 زيارة تكنولوجيا لا توجد تعليقات
    فيسبوك تويتر واتساب تيلقرام بينتيريست البريد الإلكتروني

    في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.

    لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى “ويسبر” (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.

    في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج “جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.

    مطاردات يائسة

    تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.

    مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.

    وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.

    شريان الحياة للذكاء الاصطناعي

    توضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.

    هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل “شات جي بي تي”، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.

    في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.

    لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.

    لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد “إيبوك” (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.

    بيانات اصطناعية

    أصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات “الاصطناعية”. ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.

    مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.

    وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.

    استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.

    ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين

    كيف يدعم محمد طلال بلجون عبر تطبيق شيكك ضمان في جيبك رؤية المملكة 2030؟

    لماذا تُعد بطارية HONOR Magic8 Pro بسعة 7200 مللي أمبير مهمة في الاستخدام اليومي

    دور الذكاء الاصطناعي في الكتابة الأكاديمية.. التحديات والفرص

    أين تذهب سجلات “شات جي بي تي” عندما يموت المستخدم؟

    غوغل تؤكد: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتعدى 70%

    كيف يغير دمج الذكاء الاصطناعي وإنترنت الأشياء مستقبل العالم؟

    تحديات قانونية أمام مساعي ترامب لمساعدة شركات الذكاء الاصطناعي

    غانا تشن حملة جديدة ضد الجريمة الإلكترونية

    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    وفاة الفنانة المصرية سمية الألفي بعد صراع طويل مع السرطان

    الإثنين 22 ديسمبر 1:48 ص

    أفضل مكتب تجنيس وتصريح زواج وتعقيب سعودي في المملكة

    الإثنين 22 ديسمبر 1:27 ص

    كتاب جديد: وصفة تشومسكي وموخيكا للنجاة من القرن الـ21

    الإثنين 22 ديسمبر 1:21 ص

    نائب وزير الرياضة يتوّج الأمريكي تيين بلقب بطولة الجيل القادم للتنس 2025

    الإثنين 22 ديسمبر 1:02 ص

    ترامب يربك واشنطن بشأن فنزويلا.. غزو أم تغيير نظام أم مجرد ضغط؟

    الإثنين 22 ديسمبر 12:57 ص
    اعلانات
    Demo

    رائج الآن

    رغم الجدل.. ويكيبيديا تُبقي توصيف “الإبادة” لأفعال إسرائيل في غزة

    الإثنين 22 ديسمبر 12:24 ص

    رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين

    الأحد 21 ديسمبر 11:45 م

    ختام ناجح للمؤتمر والملتقى الدولي للتكنولوجيات المساعدة لذوي الاحتياجات الخاصة

    الأحد 21 ديسمبر 11:39 م

    هل يشكل حصار أميركا البحري على فنزويلا ضربة للاقتصاد الروسي؟

    الأحد 21 ديسمبر 11:28 م

    لامين جمال يكتسح ميسي في سباق القمصان الأكثر مبيعاً بالعالم

    الأحد 21 ديسمبر 10:54 م
    فيسبوك X (Twitter) تيكتوك الانستغرام يوتيوب
    2025 © وادي السعودية. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • إعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟