منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

24-07-2025
ميتا تعزز سلامة المراهقين من خلال حماية جديدة في رسائل إنستغرام المباشرة وإجراءات أمان للحسابات
تطرح ميتا ميزات أمان محسّنة للمستخدمين المراهقين على إنستغرام، بما في ذلك حماية جديدة للرسائل المباشرة وسياق الحساب، مع توسيع نطاق الضمانات لتشمل الحسابات الموجهة للعائلة.
22-05-2025
كيشا ترد على انتقادات المعجبين بشأن استخدام الذكاء الاصطناعي في فنها
كيشا ترد على انتقادات المعجبين بشأن استخدام الذكاء الاصطناعي في غلاف أغنيتها الجديدة "Delusional"، مشددة على أهمية الفن البشري.
08-07-2025
حصل روبوت على شهادة في حفل تخرج المدرسة الثانوية في الصين
حصل روبوت شبيه بالبشر على شهادة في حفل تخرج من المدرسة الثانوية في فوجيان، الصين، مما يمثل لحظة فكاهية وهامة لدمج الذكاء الاصطناعي.
26-05-2025
آبل تستعد لإطلاق مركزها الذكي للمنزل في نهاية العام
تستعد آبل لإطلاق مركزها الذكي للمنزل بحلول نهاية العام، مع تصميم يجمع بين HomePod وiPad ونظام تشغيل جديد. تعرف على التفاصيل.
30-05-2025
الوقت المستغرق لإنهاء ألعاب الفيديو يرتفع بنسبة 61%: ما هي الألعاب الأطول؟
دراسة حديثة تكشف عن زيادة بنسبة 61% في متوسط الوقت اللازم لإنهاء ألعاب الفيديو، مع تفاصيل عن الألعاب الأطول والأقصر وتأثير ذلك على تجربة اللاعبين.
11-06-2025
فك شفرة الواقع: كيف يرى روبوت أطلس من بوسطن ديناميكس العالم
اكتشف كيف يدرك روبوت أطلس البشري من بوسطن ديناميكس بيئته ويتفاعل معها من خلال دمج المستشعرات المتقدم ورسم الخرائط في الوقت الفعلي.
17-06-2025
ميتا وأوكلي يروجان لإطلاق النظارات الذكية في 20 يونيو
تستعد ميتا وأوكلي للكشف عن نظارات ذكية جديدة في 20 يونيو، بناءً على إرث ميتا من راي بان بتصاميم رياضية وميزات محسنة.
16-07-2025
سامسونج قد تتبنى أخيرًا شحن Qi2 اللاسلكي: ما الذي يمكن توقعه
يشير استطلاع تطبيق Samsung Members حول مغناطيس الشحن اللاسلكي Qi2، وسُمك الجهاز، واستخدام USB-C إلى احتمال اعتماده في طرز Galaxy القادمة.
10-07-2025
انقطاع في Outlook: آلاف المستخدمين يتأثرون بتعطيل البريد الإلكتروني
واجه آلاف المستخدمين لبرنامج Microsoft Outlook انقطاعات في خدمة البريد الإلكتروني، بما في ذلك مشاكل في التحميل وتسجيل الدخول، ليلة الأربعاء وصباح الخميس. تقوم Microsoft بنشر إصلاح مصحح بعد فشل العلاج الأولي.
19-06-2025
بكين تقود الثورة في مجال الروبوتات الشبيهة بالبشر
تتطور بكين بسرعة لتصبح مركزًا عالميًا للروبوتات الشبيهة بالبشر، مدفوعة بالاختراقات التكنولوجية، والنمو الصناعي المتزايد، والأحداث العالمية القادمة. تعرف على الابتكارات والخطط المستقبلية.
22-07-2025
iPhone 18: الكشف عن تشكيلة Apple الثورية لعام 2026
استكشف تشكيلة iPhone 18 القادمة من Apple، والتي تتميز بأول iPhone قابل للطي، ونماذج Pro متطورة مع Face ID أسفل الشاشة، واستراتيجية إصدار مقسمة جديدة لعامي 2026 و 2027.
08-07-2025
أعلنت كروكس وأنيمال كروسينج عن أول تعاون بينهما على الإطلاق، والذي سينطلق في 27 أغسطس
تتعاون Crocs و Animal Crossing في أول تعاون لهما على الإطلاق، والذي ينطلق في 27 أغسطس. اكتشف الأحذية الخشبية ذات الطابع الخاص للبالغين والأطفال، بالإضافة إلى تعليقات Jibbitz القابلة للتخصيص والتي تضم شخصيات محبوبة مثل Tom Nook و K.K. Slider. استعد للدخول إلى عالم Animal Crossing مع هذه المجموعة الفريدة من الأحذية.
23-06-2025
يونيتري روبوتيكس: رائدة ثورة الروبوتات في الصين
تتصدر شركة Unitree Robotics ثورة الروبوتات في الصين، حيث يتصور الرئيس التنفيذي وانغ شينغ شينغ مستقبلًا تندمج فيه الروبوتات المتقدمة في الحياة اليومية والعمل، مدفوعة بالتقدم في الذكاء الاصطناعي.
24-07-2025
ثورة الفيديو بالذكاء الاصطناعي: يوتيوب شورتس وجوجل فوتوز يحصلان على تحول بالذكاء الاصطناعي التوليدي
تطرح جوجل ميزات الذكاء الاصطناعي التوليدي للفيديو لمنصتي YouTube Shorts و Google Photos، مما يتيح إنشاء الفيديو من النص وتأثيرات مدعومة بالذكاء الاصطناعي. تعرف على الأدوات الجديدة والتكامل المستقبلي مع نموذج Veo 3.
18-07-2025
وجه الإيموجي المشوه: طريقتك المفضلة التالية للتعبير عن الإحراج
اكتشف الرموز التعبيرية الجديدة القادمة إلى هاتفك، بما في ذلك رمز الوجه المشوه المنتظر بشدة، والمصمم للتعبير عن الحرج والصراع الذهني.
29-05-2025
جيم كرامر: الذكاء الاصطناعي قد يكون "القوة الأكثر أهمية" في مستقبل الوظائف
جيم كرامر يتحدث عن تأثير الذكاء الاصطناعي على سوق العمل، محذرًا من زيادة البطالة وفقدان الوظائف، بينما يشير إلى الفوائد المحتملة لهذه التكنولوجيا.