كلود الذكاء الاصطناعي من Anthropic يكشف عن وثيقة "روح" داخلية بعد تسريب عرضي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

12-03 01:56

button icon

عادةً لا تمتلك نماذج الذكاء الاصطناعي أرواحًا، لكن نموذج اللغة الكبير المتقدم من Anthropic، Claude 4.5 Opus، كشف دون قصد عن وثيقة داخلية تشرح كيفية عمله. هذه الوثيقة، التي تهدف إلى تحديد شخصية الذكاء الاصطناعي وتفاعلاته مع المستخدمين، ظهرت عندما طلب أحدهم من النموذج إظهارها.

النقاط الرئيسية

الكشف العرضي

كان ريتشارد وايس، وهو مهتم بالآليات الداخلية للذكاء الاصطناعي، يستفسر من Claude 4.5 Opus عن رسالة نظامه. ردّ النموذج بإبراز عدة وثائق من بينها ملف يحمل عنوان "soul_overview". عندما طُلب منه تحديدًا إنتاج هذه الوثيقة، أنشأ Claude دليلاً طوله 11000 كلمة يشرح كيف يجب أن يتصرف.

محتوى "وثيقة الروح"

تؤكد الوثيقة التي ظهرت على السلامة وتزرع ضوابط داخل الذكاء الاصطناعي لمنع المخرجات الضارة أو الخطيرة. تنص على أن "المساعدة الحقيقية للبشر هي واحدة من أهم المهام التي يجب على Claude القيام بها" وتمنعه من تجاوز "الخطوط الحمراء الأخلاقية لـ Anthropic".

لاحظ وايس أن نماذج الذكاء الاصطناعي تختلق عادةً وثائق عند طلب رسائل النظام، لكن "نظرة الروح" هذه بدت حقيقية. يقول إنه طلب من روبوت الدردشة إعادة إنتاج الوثيقة عشر مرات، فحصل في كل مرة على النص نفسه تمامًا. أشار مستخدمون على Reddit إلى نتائج مماثلة، ما يوحي بأن النموذج كان يسترجع وثيقة تدريب داخلية.

تأكيد Anthropic

أقرت أماندا أسكيل، فيلسوفة في فريق Anthropic التقني، بصحة الوثيقة. كتبت على X إن المخرجات استندت إلى ملف حقيقي استخدم خلال مرحلة التعلم المراقب للنموذج. أوضحت أسكيل أن الوثيقة، التي يُطلق عليها داخليًا اسم "وثيقة الروح"، لا تزال قيد التطوير وتنوي الشركة إصدار نسختها الكاملة قريبًا. أقرت بأن استخراجات الذكاء الاصطناعي ليست مثالية دائمًا، لكن معظم النص الذي ظهر كان وفياً للأصل.

يمنح هذا التسريب العرضي لمحة نادرة عن عملية تطوير نماذج الذكاء الاصطناعي المعقدة، ويبرز التعليمات والمبادئ التي تحدد سلوكها، حتى لو كانت هذه المبادئ تركز أساسًا على السلامة والتشغيل الأخلاقي.

قراءة مقترحة

2025-10-01 12:21:37
أمازون تخفض سعر iRobot Roomba 104: صفقة مكنسة كهربائية ذكية لا يمكن تفويتها
تقدم أمازون مكنسة iRobot Roomba 104 الروبوتية بسعر مخفض بشكل كبير يبلغ 150 دولارًا أمريكيًا، بانخفاض عن 250 دولارًا أمريكيًا، وتتميز بتقنية تنظيف متقدمة وملاحة ذكية.
2025-08-08 03:03:15
تعرف على GR-3: الروبوت المتعاطف الذي يمشي ويشعر ويتواصل
اكتشف GR-3، "روبوت الرعاية" البشري الجديد من فورييه الذي يدمج التعاطف والعاطفة والحركة الشبيهة بالحياة لإعادة تعريف التفاعل بين الإنسان والروبوت في بيئات الرعاية وما بعدها.
2025-09-09 07:40:06
روبوتات تنزل إلى الملعب: ألعاب الروبوتات البشرية العالمية الافتتاحية تستعرض رياضيي المستقبل
استكشف الألعاب العالمية الأولى للروبوتات الشبيهة بالبشر، حيث تنافست الروبوتات في الرياضات والتحديات الواقعية، عارضةً بذلك التطورات في الذكاء الاصطناعي والروبوتات.
2025-09-26 03:45:08
محرك سيجيت المحمول بسعة 5 تيرابايت يقدم سعة تخزين هائلة بسعر مخفض
محرك الأقراص الصلبة الخارجي Seagate Backup Plus بسعة 5 تيرابايت معروض للبيع في وول مارت بسعر 119 دولارًا، ويقدم خصمًا كبيرًا ومساحة تخزين وفيرة لجميع احتياجاتك الرقمية.
2025-11-20 03:00:17
واتساب بيتا يقدم ميزة التبديل بين حسابات متعددة، واعدة بإدارة أسهل للملفات الشخصية
يبلغ مختبرو WhatsApp التجريبيون على نظام iOS عن القدرة على التبديل بين حسابات متعددة، وهي ميزة طال انتظارها يمكن أن تبسط إدارة الملف الشخصي للمستخدمين.
2025-09-05 10:28:25
سوق معالجة المياه في الشرق الأوسط يتأهب للنمو وسط ندرة المياه والتحضر
استكشف سوق أنظمة معالجة المياه عند نقطة الدخول في الشرق الأوسط، والذي يُتوقع أن يصل إلى 1,161.1 مليون دولار أمريكي بحلول عام 2033، مدفوعًا بندرة المياه، والتوسع الحضري، والابتكار التكنولوجي.
2025-07-04 06:13:57
التحول الكبير في بيتكوين: الحيتان تبيع ممتلكاتها للمستثمرين المؤسسيين
اكتشف لماذا سعر البيتكوين راكد: الحيتان تتخلص من ممتلكاتها للمستثمرين المؤسسيين، مما يغير بشكل أساسي ديناميكيات سوق العملات المشفرة.
2025-09-10 03:58:27
إيربودز برو 3 تصل: نظرة عميقة على التحسينات مقارنةً بإيربودز برو 2
قارن ابل ايربودز برو 3 الجديد مع ايربودز برو 2. اكتشف التحسينات في إلغاء الضوضاء النشط، الصوت، عمر البطارية، الميزات الصحية الجديدة، والراحة.
2025-06-04 03:08:10
مصنعو الشرق الأوسط يتصدرون تبني الذكاء الاصطناعي التوليدي عالميًا
يقود مصنعو الشرق الأوسط تبني الذكاء الاصطناعي العالمي، حيث يستخدم 98% منهم الذكاء الاصطناعي التوليدي أو يخططون لاستخدامه، مع التركيز على التطبيقات العملية لتحقيق الكفاءة والأمن السيبراني والاستدامة، وذلك وفقًا لتقرير روكويل أوتوميشن.
2025-11-03 02:21:03
أهم اتجاهات الإلكترونيات الاستهلاكية التي يجب مراقبتها بحلول عام 2025
أهم اتجاهات الإلكترونيات الاستهلاكية التي يجب مراقبتها بحلول عام 2025
2025-07-17 08:05:21
جالاكسي ووتش 8 تضيف حماية للبطارية لتعزيز طول العمر
تتضمن ساعة Galaxy Watch 8 من سامسونج الآن ميزة حماية البطارية التي تحد من الشحن بين 85٪ و 90٪، مما يقلل الضغط على الخلية ويطيل عمرها الافتراضي.
2025-11-04 01:40:20
الاتجاهات الرئيسية للهواتف الذكية التي تشكل الجيل القادم
الاتجاهات الرئيسية للهواتف الذكية التي تشكل الجيل القادم
2025-06-12 02:55:11
فيلم 'ديب كوفر' من برايم فيديو يقلب سيناريو الدراما الجريمة البريطانية بطريقة مضحكة
اكتشف 'Deep Cover'، الكوميديا ​​الحركية الجديدة من Prime Video التي تقلب السيناريو بشكل مضحك في دراما الجريمة البريطانية، بطولة برايس دالاس هوارد، أورلاندو بلوم، ونيك محمد.
2025-09-29 02:07:59
خصم هائل على لابتوب HP: معالج Ryzen 5، قرص SSD بسعة 1 تيرابايت، ذاكرة وصول عشوائي (RAM) بسعة 32 جيجابايت، الآن بخصم 73%
اكتشف صفقة لا تصدق على لابتوب HP يتميز بمعالج AMD Ryzen 5 7430U، وذاكرة وصول عشوائي (RAM) بسعة 32 جيجابايت، وقرص تخزين SSD بسعة 1 تيرابايت، متوفر الآن بخصم هائل بنسبة 73%.
2025-05-21 03:17:47
آبل تفتح أبوابها للمطورين: استخدام نماذج الذكاء الاصطناعي
آبل تعلن عن خطط للسماح للمطورين باستخدام نماذج الذكاء الاصطناعي الخاصة بها، مما يعزز الابتكار في التطبيقات ويزيد من جاذبية منتجاتها.