معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

16-10-2025
ميزة ويندوز الجديدة من مايكروسوفت للأجهزة المحمولة تغير قواعد اللعبة، ولكن ليس للجميع
تجربة "ملء الشاشة" الجديدة من مايكروسوفت لأجهزة الكمبيوتر المحمولة مخصصة حصريًا لجهاز Asus ROG Xbox Ally، وتقدم وصولاً محسّنًا للألعاب وأداءً أفضل، لكنها تواجه أخطاء مبكرة وتحديات في التثبيت للأجهزة الأخرى.
08-09-2025
روبوت أوبتيموس البالغ سعره 500,000 دولار من إيلون ماسك يتعثر في عرض توضيحي، ويكافح مع طلبات أساسية
روبوت أوبتيموس الخاص بإيلون ماسك، البالغ قيمته 500 ألف دولار، يواجه صعوبة في الحركات الأساسية والأسئلة البسيطة في عرض توضيحي حديث، مما يثير شكوكًا حول قدراته وإمكاناته المستقبلية.
09-06-2025
نزال كوني: مجموعتان مجرتان تستعدان للاصطدام الثاني
مجموعتان من العناقيد المجرية داخل نظام PSZ2 G181 تستعدان لاصطدام ثانٍ، وهو حدث كوني نادر يقدم رؤى جديدة حول اندماجات العناقيد المجرية منخفضة الكتلة.
29-05-2025
إي إيه إنترتينمنت تركز على عدد أقل من السلاسل في المستقبل
تتجه إي إيه إنترتينمنت نحو تقليص عدد سلاسل الألعاب التي تطورها، مع التركيز على ألعاب محددة مثل Battlefield وThe Sims وApex Legends.
16-07-2025
من المتوقع إطلاق الإصدار التجريبي العام لنظام iOS 26 في 23 يوليو
تستهدف Apple يوم 23 يوليو لإطلاق النسخة التجريبية العامة لنظام iOS 26، مما يمثل تأخيرًا طفيفًا عن الإصدارات التجريبية الصيفية السابقة. إليك كل ما يحتاج المختبرون معرفته.
24-07-2025
تي-ساتالايت من تي-موبايل: إرسال الرسائل النصية من المناطق الميتة أصبح سهلاً
استكشف خدمة الرسائل النصية عبر الأقمار الصناعية الجديدة من تي-موبايل المدعومة بستارلينك، تي-ساتالايت. اكتشف كيف تعمل، وميزاتها الرئيسية، وكيف تقارن بخيارات الاتصال عبر الأقمار الصناعية الأخرى.
20-06-2025
الروبوت الرائد: الروبوت البشري الصيني يصبح أول مرشد للمشي لمسافات طويلة في جبل تاي
روبوت بشري صيني يصنع التاريخ كأول روبوت من نوعه يرشد المتنزهين في جبل تاي، مما يشير إلى حقبة جديدة للسياحة والروبوتات.
14-10-2025
نهاية دعم ويندوز 10: ما يحتاج المستخدمون معرفته حول الانتقال
تنهي مايكروسوفت دعم نظام التشغيل ويندوز 10 في 14 أكتوبر 2025. تعرف على ما يعنيه هذا للمستخدمين، وكيفية الحصول على تحديثات الأمان الممتدة، ومتطلبات الترقية إلى ويندوز 11.
20-10-2025
روبوت شبيه بالبشر يتجول: فيديو فيروسي يلتقط أعجوبة ميكانيكية في شوارع هولندا
شاهد مقطع فيديو فيروسي لروبوت شبيه بالبشر يسير في شوارع لاهاي، هولندا، برفقة شخص. اكتشف تفاصيل هذه الرحلة الروبوتية غير العادية.
20-10-2025
بنك طاقة ضخم بسعة 50000 مللي أمبير يصل إلى أدنى سعر له على الإطلاق على أمازون
اكتشف باور بانك Ohoviv بسعة 50000 مللي أمبير في الساعة، الآن بسعر منخفض على الإطلاق يبلغ 32 دولارًا على أمازون لأعضاء برايم. تعرف على سعته الهائلة، والشحن السريع، والكابلات المدمجة.
13-10-2025
الروبوتات الشبيهة بالبشر تدخل الساحة: نظرة عملية على فاونديشن فانتوم MK1
استكشف الروبوت الشبيه بالبشر فانتوم MK1 من مؤسسة فاونديشن، وتطبيقاته المحتملة في الصناعة والدفاع واستكشاف الفضاء. احصل على نظرة عملية على قدراته في التشغيل عن بعد.
08-10-2025
روبوروك Q10 S5+: مكنسة روبوتية تُحدث ثورة في تنظيف المنزل بدون تدخل يدوي بسعر قياسي منخفض
اكتشف روبوروك Q10 S5+، مكنسة وممسحة روبوتية متقدمة توفر 70 يومًا من التنظيف بدون تدخل، مع ميزات قوية، ومتوفرة الآن بسعر قياسي منخفض. تعرف على تقنيتها المتطورة ولماذا تُعد خيارًا مثاليًا للمنازل العصرية.
09-09-2025
يواجه قطاع التكنولوجيا تباطؤًا في التوظيف: ارتفاع التسريحات بينما تكافح الولايات للاحتفاظ بالمواهب
استكشف أحدث تقرير للوظائف في الولايات المتحدة يكشف عن تباطؤ في قطاع التكنولوجيا، مع فقدان الوظائف وصعوبة الولايات في جذب واستبقاء المواهب التقنية. افهم التحول نحو الأتمتة والمهارات المتخصصة.
11-08-2025
مول الروبوتات في الصين يكشف عن مستقبل "الذكاء الاصطناعي المادي" بقيمة 20 تريليون دولار
الصين تفتتح أول مركز تجاري للروبوتات في العالم، مما يشير إلى تحول عالمي ضخم نحو "الذكاء الاصطناعي المادي" وازدهار اقتصادي محتمل بقيمة 20 تريليون دولار. استكشف صعود الروبوتات وتأثيرها على الصناعات والقوى العاملة.
23-09-2025
تلفزيون جوجل يتبنى ذكاء جيميني الاصطناعي لتجربة مشاهدة أكثر حوارية
تلفزيون جوجل يدمج الذكاء الاصطناعي Gemini ليقدم تجربة مشاهدة أكثر تفاعلية وبديهية، مما يغير طريقة اكتشاف المستخدمين للمحتوى وتفاعلهم مع أجهزة التلفزيون الخاصة بهم.
16-06-2025
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات، ويصبح أسرع جهاز ألعاب مبيعًا في تاريخ الولايات المتحدة
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات في الولايات المتحدة واليابان، ليصبح الأجهزة الأسرع مبيعًا في تاريخ الألعاب ويضع معايير عالمية جديدة.