معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

10-01 12:20

button icon

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

2025-10-29 02:12:15
وانغ شينغ شينغ: العقل المدبر وراء الثورة الروبوتية في الصين
اكتشف قصة وانغ شينغ شينغ، مؤسس شركة يونيتري للروبوتات، وكيف جلب الروبوتات المتقدمة في الصين إلى الساحة الوطنية، مسلطًا الضوء على صناعة الروبوتات المزدهرة في البلاد.
2025-11-21 01:39:57
مشاركة سريعة مقابل AirDrop: سد فجوة نقل الملفات بين أندرويد وآبل
يجلب تطبيق Quick Share الجديد توافق AirDrop إلى Android، مما يتيح مشاركة الملفات السريعة والآمنة مع أجهزة Apple. تعرف على كيفية مقارنة كليهما في عام 2024.
2025-12-03 02:07:34
مقارنة الروبوت البشري ثنائي الأرجل 01 ألفا مع معايير الصناعة
مقارنة بين الروبوت ثنائي الأرجل 01 Alpha من Humanoid والمعايير الصناعية، مع تحليل السرعة والأداء والتطبيق في القطاعات الصناعية والمنزلية.
2025-07-03 09:37:17
حصلت Galbot على 153 مليون دولار لدفع عجلة تسويق الروبوت شبه البشري G1
حصلت Galbot على تمويل بقيمة 153 مليون دولار لتسويق روبوتها شبه البشري G1، المصمم للمهام الآلية في البيئات التجارية والصناعية، والمدعوم بنماذج VLA المتقدمة.
2025-05-26 05:35:36
هل يمكن للذكاء الاصطناعي حل أزمة الغذاء العالمية القادمة؟
تستعرض المقالة كيف يمكن للذكاء الاصطناعي أن يسهم في حل أزمة الغذاء العالمية المتزايدة بحلول عام 2050، مع التركيز على أهمية التعاون بين التخصصات.
2025-10-06 05:00:49
تسريب كبير يشير إلى أن إكس بوكس قد تتخلى عن أجهزة الكونسول من أجل مستقبل يعتمد فقط على البرمجيات
تشير تسريبات كبيرة إلى أن مايكروسوفت قد تتوقف عن تصنيع أجهزة إكس بوكس وتركز على البرمجيات والألعاب السحابية، مما يشير إلى تحول كبير في استراتيجية الشركة.
2025-08-08 03:10:06
اختراق جيميني: الباحثون يتحكمون بالمنازل الذكية عبر دعوات التقويم
نجح باحثون في اختراق Google Gemini AI، باستخدام دعوات التقويم للتحكم في أجهزة المنزل الذكي. تعرف على الثغرة الأمنية واستجابة جوجل.
2025-11-03 02:18:26
أهم اتجاهات الذكاء الاصطناعي التي يجب مراقبتها بحلول عام 2025
أهم اتجاهات الذكاء الاصطناعي التي يجب مراقبتها بحلول عام 2025
2025-10-03 10:49:28
تشير التقارير إلى أن سماعة الرأس XR "Project Moohan" من سامسونج تستعد للإطلاق الوشيك
ورد أن سماعة الرأس XR "Project Moohan" من سامسونج ستنطلق في أواخر أكتوبر، مع بدء الطلبات المسبقة في 15 أكتوبر. من المتوقع أن يتميز الجهاز المتميز بتقنية عرض متقدمة ويتنافس مع عروض XR المتطورة.
2025-06-20 04:11:02
تطبيق Gemini يطلق ميزة تحميل وتحليل الفيديو عبر جميع المنصات
اكتشف كيف يتيح تطبيق Gemini من Google الآن تحميل مقاطع الفيديو وتحليلها على Android و iPhone والويب، مما يعزز قدرات الذكاء الاصطناعي متعدد الوسائط لجميع المستخدمين.
2025-10-23 02:20:03
OpenAI تكشف عن متصفح ChatGPT Atlas: حقبة جديدة لتصفح الويب أم مصدر قلق للخصوصية؟
أطلقت OpenAI متصفح الويب الجديد ChatGPT Atlas المدعوم بالذكاء الاصطناعي. استكشف ميزاته، وكيفية تنزيله، ومخاوف الخصوصية التي أثارها الخبراء قبل أن تبدأ.
2025-08-13 03:11:27
سامسونج جالكسي S25 FE من المقرر إطلاقه في سبتمبر: شريحة إكسينوس، وميزات الذكاء الاصطناعي، وتصميم مطور متوقع
يشاع أن هاتف Samsung Galaxy S25 FE سيُطلق في سبتمبر مع شريحة Exynos 2400e وتصميم محسّن وشاشة AMOLED بتردد 120 هرتز وبطارية بسعة 4900 مللي أمبير في الساعة.
2025-07-21 03:20:53
عودة كومودور المحفوفة بالمخاطر: هل يمكن للحنين إلى الماضي أن يدعم حقبة جديدة؟
يحاول كريستيان سيمبسون إحياء علامة كومودور التجارية الشهيرة، بإطلاق جهاز كومودور 64 ألتميت. هل يمكن للحنين إلى الماضي وشغف المجتمع التغلب على تحديات السوق وتجزئة الملكية؟
2025-08-29 02:15:57
الصين رائدة في تكنولوجيا المفاعلات النووية "المقاومة للانصهار"
تختبر الصين نظام أمان جديد لمفاعلاتها السريعة المتكاملة (IFRs)، بهدف إنشاء محطات طاقة نووية "مقاومة للانصهار" والمضي قدمًا في تحقيق أهدافها المتعلقة بالطاقة النظيفة.
2025-11-10 02:11:15
خصم هائل على مكنسة شارك نافيجيتور ليفت أواي ديلوكس على أمازون: بيع أكثر من 40 ألف وحدة هذا الشهر
اكتشف الصفقة المذهلة على المكنسة الكهربائية Shark Navigator Lift-Away Deluxe على أمازون، بخصم يقارب 50٪ الآن. تعرف على ميزاتها ولماذا تم بيع أكثر من 40 ألف وحدة هذا الشهر.