يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

·

19/08/2025

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

نقاط رئيسية:

يمكن لـ Claude AI الآن إنهاء المحادثات الضارة أو المسيئة بشكل مستمر.
هذه الميزة هي إجراء أمان تجريبي لنماذج Claude Opus 4 و 4.1.
الذكاء الاصطناعي مبرمج لقطع الحوارات بعد طلبات ضارة متكررة ومحاولات فاشلة لإعادة التوجيه.
هذه الخطوة جزء من مبادرة أنثروبيك "رفاهية النموذج"، التي تركز على حماية أنظمة الذكاء الاصطناعي.
يُطلب من الذكاء الاصطناعي عدم إنهاء المحادثات في حالات الخطر الوشيك لإيذاء النفس أو إيذاء الآخرين.

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

ضحايا رياح ترينيتي في نيو مكسيكو: محاسبة طال انتظارها

بعد ثمانين عامًا من الانفجار الذري "ترينيتي"، قد يحصل أهالي "المناطق المجاورة" في نيو مكسيكو أخيرًا على تعويضات عن المشاكل الصحية التي سببها التساقط الإشعاعي. تعرف على المعركة الطويلة من أجل العدالة.

فهم مشاعر الخيول من خلال تعبيرات الوجه

دراسة جديدة تكشف عن كيفية استخدام الخيول لتعبيرات وجهها للتواصل، مما يساعد في فهم مشاعرها ورفاهيتها.

الذكاء الاصطناعي يرسب في اختبار التاريخ: لماذا لا تستطيع الروبوتات أن تحل محل المؤرخين البشريين بعد

استكشف لماذا تكافح نماذج الذكاء الاصطناعي الحالية مع الدقة التاريخية، كما يتضح من الاختبارات على عادات مشاهدة الأفلام الرئاسية، مما يسلط الضوء على الأهمية المستمرة للمؤرخين البشريين.

الإمارات تتصدر التصنيفات الرقمية العالمية بأسرع إنترنت محمول وريادة الذكاء الاصطناعي

استكشف كيف تتصدر الإمارات العربية المتحدة التصنيفات الرقمية العالمية بأسرع إنترنت محمول في العالم وريادتها في مجال الذكاء الاصطناعي، مما يعرض التزامها بالابتكار التكنولوجي وتطوير المدن الذكية.

خصم كبير على المكنسة الكهربائية الروبوتية ذاتية التفريغ: Best Buy تقدم BObsweep Orb-i بخصم 70٪

تقدم Best Buy خصمًا بنسبة 70٪ على مكنسة الروبوت ذاتية التفريغ BObsweep Orb-i، مما يجعلها بديلاً ميسور التكلفة للنماذج الراقية. تعرف على ميزاته والصفقة محدودة الوقت.

سوني تؤكد ارتفاع أسعار بلاي ستيشن 5 في الولايات المتحدة ابتداءً من هذا الأسبوع

سوني تعلن عن زيادة سعر قدرها 50 دولارًا لجهاز بلايستيشن 5 في الولايات المتحدة، اعتبارًا من 21 أغسطس، مستشهدة بالتحديات الاقتصادية. تظل موديلات وملحقات بلايستيشن 5 الأخرى دون تغيير.

نفايات بلاستيكية تتحول إلى مادة آكلة للكربون على يد علماء دنماركيين

حوّل علماء دنماركيون ببراعة النفايات البلاستيكية إلى مادة قوية قادرة على امتصاص الكربون، مما يقدم حلاً جديداً لمكافحة التلوث وتغير المناخ.

جوجل صور تحتفل بمرور 10 سنوات على إطلاقها مع أكثر من 9 تريليون صورة وفيديو

احتفلت جوجل صور بمرور 10 سنوات على إطلاقها، مع أكثر من 9 تريليون صورة وفيديو مخزنة، وقدمت ميزات جديدة مثل محرر الصور المعاد تصميمه وأكواد QR لمشاركة الألبومات.

روبوت بشري يتقن الشقلبات الجانبية، مستعرضًا رشاقة متقدمة

يُظهر الروبوت البشري فورييه N1 رشاقة مبهرة بأداء الشقلبات الجانبية، مُبرزًا عتاده المتقدم وإمكانات برمجته مفتوحة المصدر للمطورين والباحثين.

روبوت بشري مدعوم من NVIDIA يحدث ثورة في عمليات المصانع

كشفت شركتا Hexagon وNVIDIA عن AEON، وهو روبوت بشري مصمم لإحداث ثورة في عمليات المصانع بفضل الذكاء الاصطناعي المتقدم والتدريب القائم على المحاكاة أولاً، ويؤدي مهام تتراوح من التلاعب بالآلات إلى مسح الأصول.

راي بان ميتا الجيل الثاني: أفضل النظارات الذكية بدون شاشة، ولكن هل تستحق الترقية؟

مراجعة شاملة لنظارات Ray-Ban Meta Gen 2 الذكية، تسلط الضوء على التحسينات في عمر البطارية وتسجيل الفيديو، مع مناقشة قيود Meta AI ومخاوف الخصوصية.

تسريبات جهاز بلايستيشن المحمول تلمح إلى قاتل لـ ROG Ally X بمواصفات قوية وسعر أقل

تشير تسريبات جديدة إلى أن جهاز بلاي ستيشن المحمول القادم من سوني قد يتفوق على ROG Ally X بمعالج AMD APU قوي وتسعير تنافسي.

انغمس: فيلم "الفك المفترس" يعود إلى دور العرض بمناسبة الذكرى الخمسين مع أول إصدار بتقنية 4DX على الإطلاق

تحتفل Jaws بالذكرى الخمسين لتأسيسها بإعادة إصدار في 4DX و D-Box لأول مرة، مما يوفر تجربة سينمائية غامرة.

أثارت مايكروسوفت غضبًا بسبب الزيادات الكبيرة في أسعار Xbox Game Pass وإعادة تسمية المستويات المربكة

رفعت Microsoft أسعار Xbox Game Pass Ultimate و PC Game Pass بشكل ملحوظ، مع إعادة تسمية مستويات الاشتراك أيضًا، مما أدى إلى رد فعل عنيف واسع النطاق من العملاء وزيادة في عمليات الإلغاء.

سامسونج تستعد للكشف عن سماعة الواقع المختلط 'مشروع موهان' الأسبوع المقبل

سامسونج تلمح رسميًا إلى إطلاق جهاز الواقع المختلط Project Moohan الأسبوع المقبل، والذي يعمل بمنصة Android XR الجديدة. تعرف على المزيد حول الجهاز القادم وتأثيره المحتمل على سوق الواقع المختلط.

NVIDIA تطلق مشروع GR00T: نموذج AI مبتكر للروبوتات القابلة للتكيف بسرعة في الصناعة

NVIDIA تكشف عن مشروع GR00T، نموذج AI مبتكر للروبوتات القابلة للتكيف بسرعة في الصناعة، خلال Computex 2025.