معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

04-07-2025
معضلة ملكية OpenAI: الرموز المزيفة وإيلون ماسك وعالم استثمار الذكاء الاصطناعي الغامض
استكشف الجدل الأخير المحيط بـ "رموز OpenAI" وادعاء إيلون ماسك بشأن حقوق ملكية OpenAI، مع تسليط الضوء على الطبيعة المعقدة للملكية في عملاق الذكاء الاصطناعي.
20-10-2025
سعر آيباد آبل يصل إلى أدنى مستوى له على الإطلاق في أمازون: صفقة لا يمكن تفويتها؟
اكتشف الصفقة المذهلة على جهاز آيباد مقاس 11 بوصة بشريحة A16 على أمازون، بسعر هو الأدنى على الإطلاق عند 299 دولارًا. تعرف على ميزاته القوية ولماذا يجب عليك شراؤه.
29-05-2025
تعزيز التطبيقات المعتمدة على البيانات من خلال بنية تحتية مدعومة بالذكاء الاصطناعي
تستثمر صناعة الرعاية الصحية في تقنيات الذكاء الاصطناعي لتعزيز الكفاءة، ولكنها تحتاج إلى بنية تحتية قوية لدعم التطبيقات المعتمدة على البيانات.
21-10-2025
وحدة روبوت H2 من Unitree تبهر بحركات رقص وحركات قتالية واقعية
تكشف شركة Unitree Robotics عن الروبوت البشري H2، الذي يعرض رقصًا واقعيًا وحركات قتالية وخفة حركة مذهلة. تعرف على قدراته وتقدمه في مجال الروبوتات البشرية.
16-07-2025
عمالقة التكنولوجيا يراهنون على أن الذكاء الاصطناعي على وشك تحقيق اكتشاف علمي
يدعي مليارديرات التكنولوجيا في بودكاست All-In أن أدوات مثل Grok قريبة من تحقيق اختراقات علمية حقيقية، لكن الخبراء يسلطون الضوء على القيود الكامنة في الذكاء الاصطناعي والضجيج الإعلامي.
11-10-2025
نظارات سامسونج الذكية: التحدي الكبير المقبل لنظارات راي بان وميتا؟
تُشير الشائعات إلى أن سامسونج تعتزم إطلاق نظاراتها الذكية بتقنية الواقع المعزز بالتعاون مع جوجل، مما قد يشكل تحدياً لنماذج راي-بان التابعة لميتا في أقرب وقت ممكن من العام القادم. تعرف على ما قد يعنيه ذلك لمستقبل تكنولوجيا الأجهزة القابلة للارتداء.
25-06-2025
مؤلف ويتشر يتفهم تأخير مارتن في 'رياح الشتاء'
أندريه سابكوفسكي، مؤلف سلسلة "الويتشر"، يشارك رؤاه حول سبب استغراق جورج ر. ر. مارتن وقتًا طويلاً لإنهاء "رياح الشتاء"، مشيرًا إلى اقتباس مسلسل "صراع العروش" التلفزيوني.
02-07-2025
كرة القدم الآلية تظهر لأول مرة مع خروج محرج على نقالة
اكتشف العالم المرح والدرامي بشكل مفاجئ لكرة القدم الآلية، حيث يتقن بالفعل الروبوتات الشبيهة بالبشر والمدعومة بالذكاء الاصطناعي فن الخروج من الملعب على نقالة.
09-06-2025
تكشف شركة فيجور روبوتيكس عن فيجور 02 وتلمح إلى فيجور 03
تكشف شركة فيجر روبوتيكس عن Figure 02 بشبكتها العصبية الحلزونية وتلمح إلى Figure 03 القادم، مما يعرض التطورات في الروبوتات الشبيهة بالبشر والذكاء الاصطناعي.
09-09-2025
موسم الأربعاء 3: المبدعون يلمحون إلى استكشاف أعمق للشخصيات وأسرار عائلية ممتدة
مبدعو مسلسل 'وينزداي' على نتفليكس يلمحون إلى خطط الموسم الثالث، مع التركيز على عمق الشخصيات، وألغاز العائلة الممتدة، واحتمالية وجود مسلسلات فرعية.
16-10-2025
جوجل تقدم ميزة "اتصل بصديق" لاستعادة الحساب
تتيح ميزة "جهات اتصال الاسترداد" الجديدة من جوجل للمستخدمين تعيين أصدقاء موثوق بهم لمساعدتهم في استعادة حساباتهم. تعرف على هذه الميزة وغيرها من إجراءات الأمان الجديدة من جوجل.
20-10-2025
روبوت المكنسة الكهربائية ماتيك: رفيق تنظيف ساحر وقادر
اكتشف المكنسة الروبوتية ماتيك، وهي جهاز تنظيف ساحر وعالي الأداء يضع الخصوصية وتجربة المستخدم في مقدمة أولوياته بتصميمه الفريد ومعالجته على الجهاز.
15-08-2025
7000 خطوة في اليوم قد يكون هدفك الأكثر صحة، دراسة جديدة تكشف
تشير أبحاث جديدة إلى أن 7000 خطوة يومياً قد تكون كافية لجني فوائد صحية كبيرة، مما يتحدى هدف الـ 10000 خطوة الراسخ منذ فترة طويلة. اكتشف العلم وراء الحركة اليومية وكيفية زيادة عدد خطواتك.
23-06-2025
يونيتري روبوتيكس: رائدة ثورة الروبوتات في الصين
تتصدر شركة Unitree Robotics ثورة الروبوتات في الصين، حيث يتصور الرئيس التنفيذي وانغ شينغ شينغ مستقبلًا تندمج فيه الروبوتات المتقدمة في الحياة اليومية والعمل، مدفوعة بالتقدم في الذكاء الاصطناعي.
16-07-2025
من المتوقع إطلاق الإصدار التجريبي العام لنظام iOS 26 في 23 يوليو
تستهدف Apple يوم 23 يوليو لإطلاق النسخة التجريبية العامة لنظام iOS 26، مما يمثل تأخيرًا طفيفًا عن الإصدارات التجريبية الصيفية السابقة. إليك كل ما يحتاج المختبرون معرفته.
28-07-2025
أمازون تخفض سعر ماك بوك إير 2025 إلى 799 دولارًا: صفقة لا تفوت للعودة إلى المدارس
تقدم أمازون جهاز MacBook Air 2025 بشريحة M4 وذاكرة وصول عشوائي (RAM) بسعة 16 جيجابايت وقرص SSD بسعة 256 جيجابايت بسعر غير مسبوق قدره 799 دولارًا، مما يمثل خصمًا كبيرًا وصفقة ممتازة للعودة إلى المدارس.