Close Menu
    رائج الآن

    رغم الجدل.. ويكيبيديا تُبقي توصيف “الإبادة” لأفعال إسرائيل في غزة

    الإثنين 22 ديسمبر 12:24 ص

    رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين

    الأحد 21 ديسمبر 11:45 م

    ختام ناجح للمؤتمر والملتقى الدولي للتكنولوجيات المساعدة لذوي الاحتياجات الخاصة

    الأحد 21 ديسمبر 11:39 م
    فيسبوك X (Twitter) الانستغرام
    عاجل الآن
    • رغم الجدل.. ويكيبيديا تُبقي توصيف “الإبادة” لأفعال إسرائيل في غزة
    • رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين
    • ختام ناجح للمؤتمر والملتقى الدولي للتكنولوجيات المساعدة لذوي الاحتياجات الخاصة
    • هل يشكل حصار أميركا البحري على فنزويلا ضربة للاقتصاد الروسي؟
    • لامين جمال يكتسح ميسي في سباق القمصان الأكثر مبيعاً بالعالم
    • ‫ألعاب الأطفال قد تحتوي على مواد مؤثرة على الهرمونات‬
    • ‏نادي ذوي الإعاقة بالأحساء يحقق المركز الثاني في بطولة الباراكاراتيه بالرياض
    • دوريات الإدارة العامة للمجاهدين بحائل تضبط مواطنًا مخالفًا لنظام البيئة
    • من نحن
    • سياسة الخصوصية
    • اعلن معنا
    • اتصل بنا
    وداي السعوديةوداي السعودية
    header
    • الرئيسية
    • اخر الاخبار
    • المناطق
      • الرياض
      • المدينة المنورة
      • المنطقة الشرقية
      • مكة المكرمة
      • الباحة
      • الجوف
      • القصيم
      • تبوك
      • جازان
      • حائل
      • عسير
      • نجران
    • العالم
    • سياسة
    • اقتصاد
      • بورصة
      • عقارات
      • طاقة
    • تكنولوجيا
    • رياضة
    • المزيد
      • ثقافة
      • صحة
      • علوم
      • فنون
      • منوعات
     اختر منطقتك Login
    وداي السعوديةوداي السعودية
    الرئيسية » شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟
    تكنولوجيا

    شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟

    فريق التحريربواسطة فريق التحريرالسبت 20 يوليو 1:33 م0 زيارة تكنولوجيا لا توجد تعليقات
    فيسبوك تويتر واتساب تيلقرام بينتيريست البريد الإلكتروني

    في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.

    لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى “ويسبر” (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.

    في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج “جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.

    مطاردات يائسة

    تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.

    مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.

    وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.

    شريان الحياة للذكاء الاصطناعي

    توضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.

    هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل “شات جي بي تي”، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.

    في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.

    لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.

    لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد “إيبوك” (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.

    بيانات اصطناعية

    أصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات “الاصطناعية”. ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.

    مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.

    وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.

    استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.

    ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr تيلقرام واتساب البريد الإلكتروني

    مقالات ذات صلة

    رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين

    كيف يدعم محمد طلال بلجون عبر تطبيق شيكك ضمان في جيبك رؤية المملكة 2030؟

    لماذا تُعد بطارية HONOR Magic8 Pro بسعة 7200 مللي أمبير مهمة في الاستخدام اليومي

    دور الذكاء الاصطناعي في الكتابة الأكاديمية.. التحديات والفرص

    أين تذهب سجلات “شات جي بي تي” عندما يموت المستخدم؟

    غوغل تؤكد: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتعدى 70%

    كيف يغير دمج الذكاء الاصطناعي وإنترنت الأشياء مستقبل العالم؟

    تحديات قانونية أمام مساعي ترامب لمساعدة شركات الذكاء الاصطناعي

    غانا تشن حملة جديدة ضد الجريمة الإلكترونية

    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    اخر الأخبار

    رغم الإنفاق الكبير.. استخدام محدود للذكاء الاصطناعي بين الموظفين

    الأحد 21 ديسمبر 11:45 م

    ختام ناجح للمؤتمر والملتقى الدولي للتكنولوجيات المساعدة لذوي الاحتياجات الخاصة

    الأحد 21 ديسمبر 11:39 م

    هل يشكل حصار أميركا البحري على فنزويلا ضربة للاقتصاد الروسي؟

    الأحد 21 ديسمبر 11:28 م

    لامين جمال يكتسح ميسي في سباق القمصان الأكثر مبيعاً بالعالم

    الأحد 21 ديسمبر 10:54 م

    ‫ألعاب الأطفال قد تحتوي على مواد مؤثرة على الهرمونات‬

    الأحد 21 ديسمبر 10:15 م
    اعلانات
    Demo

    رائج الآن

    ‏نادي ذوي الإعاقة بالأحساء يحقق المركز الثاني في بطولة الباراكاراتيه بالرياض

    الأحد 21 ديسمبر 10:11 م

    دوريات الإدارة العامة للمجاهدين بحائل تضبط مواطنًا مخالفًا لنظام البيئة

    الأحد 21 ديسمبر 9:41 م

    10 شهداء ومصابين باستهداف الاحتلال مدرسة تؤوي نازحين في غزة

    الأحد 21 ديسمبر 9:31 م

    “اطردوا إسرائيل أو ألغوا المسابقة”.. المقاطعة الأوروبية ليوروفيجن تتسع

    الأحد 21 ديسمبر 9:30 م

    مرصد جيمس ويب “يرى” أقدم انفجار نجمي في تاريخ الكون

    الأحد 21 ديسمبر 8:21 م
    فيسبوك X (Twitter) تيكتوك الانستغرام يوتيوب
    2025 © وادي السعودية. جميع حقوق النشر محفوظة.
    • من نحن
    • سياسة الخصوصية
    • إعلن معنا
    • اتصل بنا

    اكتب كلمة البحث ثم اضغط على زر Enter

    تسجيل الدخول أو التسجيل

    مرحبًا بعودتك!

    Login to your account below.

    نسيت كلمة المرور؟