منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

28-05-2025
تحذير من خبير: عيوب في روبوتات تسلا "أوبتيموس" قد تعيق استخدامها في المصانع
تسلا تواجه انتقادات بشأن روبوتاتها "أوبتيموس"، حيث يشير خبير سابق إلى عيوب في تصميمها قد تعيق استخدامها في المصانع. تعرف على التفاصيل.
18-07-2025
ساعة Pixel Watch 4: قفزة نحو قابلية الإصلاح والاستدامة
يشاع أن ساعة Pixel Watch 4 القادمة ستكون قابلة للإصلاح، وهو تغيير كبير عن النماذج السابقة التي كانت عرضة لأن تصبح نفايات إلكترونية في حالة تلفها. يتماشى هذا التحول مع أهداف Google للاستدامة.
11-07-2025
آندي كوهين حول الذكاء الاصطناعي: أداة للراحة، تهديد للفكر
يناقش آندي كوهين استخدامه المدهش للذكاء الاصطناعي في المهام اليومية معربًا عن قلقه العميق بشأن قدرته المحتملة على تعزيز الكسل وتقليل التفكير النقدي لدى الأجيال القادمة.
09-09-2025
وفاة مهندس مايكروسوفت المأساوية تثير احتجاجاً ضد "ثقافة الإفراط في العمل" في صناعة التكنولوجيا
عائلة براتيك باندي، مهندس مايكروسوفت من أصل هندي البالغ من العمر 35 عامًا والذي توفي في حرم الشركة، تحث شركات التكنولوجيا على معالجة "ثقافة الإفراط في العمل" وتعزيز توازن أفضل بين العمل والحياة.
24-07-2025
فيديو ترويجي لهاتف Pixel 10 تم دحضه: مفهوم من صنع المعجبين، وليس تسريبًا رسميًا
تم دحض فيديو ترويجي مزعوم لجهاز Pixel 10 يضم شريحة Tensor G5 باعتباره مفهومًا من صنع المعجبين، مع إزالة الإسناد الأصلي في إعادة التحميل.
24-06-2025
أليكسا+ يصل إلى أكثر من مليون مستخدم في الوصول المبكر، مما يحدث ثورة في تجربة المساعد الرقمي
وصلت خدمة Alexa+ المدعومة بالذكاء الاصطناعي التوليدي من أمازون إلى أكثر من مليون مستخدم في مرحلة الوصول المبكر، وتقدم تفاعلات محسنة باللغة الطبيعية وقدرات متقدمة، مما يشير إلى خطوة كبيرة في استراتيجية أمازون لتحقيق الدخل.
13-08-2025
الكشف عن Matter 1.4.2: إعداد الواي فاي فقط قد يخفض تكاليف أجهزة المنزل الذكي
اكتشف كيف يمكن لإعداد Matter 1.4.2 الذي يعتمد على Wi-Fi فقط أن يخفض أسعار أجهزة المنزل الذكي ويعزز تجربة المستخدم بتحكم وأداء محسنين.
23-05-2025
تحديث ضخم لجهاز Steam Deck من Valve يدعم أجهزة AMD المنافسة
تحديث جديد لجهاز Steam Deck من Valve يدعم أجهزة AMD المحمولة، مع ميزات جديدة وتحسينات في الأداء.
29-07-2025
جوجل تُعيد تصميم تنبيهات أندرويد للزلازل بعد فشل حرج في تركيا
تُراجع جوجل نظامها لتنبيهات الزلازل على أندرويد بعد فشلها في إصدار تحذيرات حرجة خلال زلازل تركيا المدمرة عام 2023، وتحسين خوارزميات الكشف.
11-09-2025
الكشف عن AirPods Pro 3: ميزة إلغاء الضوضاء النشط المحسّنة، الترجمة الفورية، وميزات تتبع الصحة تصل
استكشف الميزات الجديدة لسماعات AirPods Pro 3، بما في ذلك خاصية إلغاء الضوضاء النشط المحسّنة، والترجمة الفورية، وتتبع معدل ضربات القلب. تعرّف على جودة الصوت المحسّنة وتفاصيل الإصدار.
21-08-2025
الذكاء الاصطناعي من جوجل يترجم صوتك في الوقت الفعلي، ويقوم بتزييف عميق لخطابك عبر اللغات
جوجل تكشف عن ميزة ترجمة فورية ثورية تستخدم الذكاء الاصطناعي لتزييف صوتك، مما يعزز التواصل متعدد اللغات بسرعة ودقة مبهرة.
29-07-2025
الروبوتات تتبارى: مؤتمر الذكاء الاصطناعي يشهد ملاكمين بشريين يتنازلون
الروبوتات الشبيهة بالبشر تنافست في مؤتمر الذكاء الاصطناعي العالمي بالصين، عارضةً قدرات متقدمة في الذكاء الاصطناعي والقدرات البدنية باللكمات المباشرة والخطافية والمتقاطعة. تعرف على أحدث التطورات في مجال الروبوتات.
15-08-2025
بكتيريا آكلة للحوم تصيب سباحًا في شاطئ فالموث
أصيب سباح في فالماوث، ماساتشوستس، ببكتيريا آكلة للحوم، وهي بكتيريا الضمة اللاهوائية (Vibrio vulnificus)، بعد السباحة في شاطئ أولد سيلفر. تعرف على المخاطر والوقاية.
20-05-2025
إطلاق وكالة الفضاء الأفريقية لتعزيز بيانات المناخ
أفريقيا تؤسس وكالة الفضاء الأفريقية لتعزيز بيانات المناخ ومراقبة الأرض، في خطوة هامة لمواجهة تحديات تغير المناخ.
09-08-2025
شركات التكنولوجيا الناشئة في الشرق الأوسط ترتقي عالميًا بابتكارات أصلية
تكتسب الشركات الناشئة في مجال التكنولوجيا بالشرق الأوسط اعترافاً عالمياً بابتكاراتها الأصلية وحلولها القابلة للتطوير، وتعد الإمارات العربية المتحدة مركزاً رئيسياً لهذا القطاع المزدهر.
04-07-2025
وصول Veo 3 من Google إلى الشرق الأوسط: إحداث ثورة في إنشاء الفيديو بالذكاء الاصطناعي لمستخدمي Gemini
أصبح Veo 3 من Google، وهي أداة متطورة لتوليد الفيديو بالذكاء الاصطناعي، متاحة الآن لمستخدمي Gemini في الشرق الأوسط، مما يتيح إنشاء فيديو فائق الواقعية من مطالبات نصية.