يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

18-07-2025
ضحايا رياح ترينيتي في نيو مكسيكو: محاسبة طال انتظارها
بعد ثمانين عامًا من الانفجار الذري "ترينيتي"، قد يحصل أهالي "المناطق المجاورة" في نيو مكسيكو أخيرًا على تعويضات عن المشاكل الصحية التي سببها التساقط الإشعاعي. تعرف على المعركة الطويلة من أجل العدالة.
29-05-2025
فهم مشاعر الخيول من خلال تعبيرات الوجه
دراسة جديدة تكشف عن كيفية استخدام الخيول لتعبيرات وجهها للتواصل، مما يساعد في فهم مشاعرها ورفاهيتها.
13-08-2025
الذكاء الاصطناعي يرسب في اختبار التاريخ: لماذا لا تستطيع الروبوتات أن تحل محل المؤرخين البشريين بعد
استكشف لماذا تكافح نماذج الذكاء الاصطناعي الحالية مع الدقة التاريخية، كما يتضح من الاختبارات على عادات مشاهدة الأفلام الرئاسية، مما يسلط الضوء على الأهمية المستمرة للمؤرخين البشريين.
11-08-2025
الإمارات تتصدر التصنيفات الرقمية العالمية بأسرع إنترنت محمول وريادة الذكاء الاصطناعي
استكشف كيف تتصدر الإمارات العربية المتحدة التصنيفات الرقمية العالمية بأسرع إنترنت محمول في العالم وريادتها في مجال الذكاء الاصطناعي، مما يعرض التزامها بالابتكار التكنولوجي وتطوير المدن الذكية.
30-09-2025
خصم كبير على المكنسة الكهربائية الروبوتية ذاتية التفريغ: Best Buy تقدم BObsweep Orb-i بخصم 70٪
تقدم Best Buy خصمًا بنسبة 70٪ على مكنسة الروبوت ذاتية التفريغ BObsweep Orb-i، مما يجعلها بديلاً ميسور التكلفة للنماذج الراقية. تعرف على ميزاته والصفقة محدودة الوقت.
21-08-2025
سوني تؤكد ارتفاع أسعار بلاي ستيشن 5 في الولايات المتحدة ابتداءً من هذا الأسبوع
سوني تعلن عن زيادة سعر قدرها 50 دولارًا لجهاز بلايستيشن 5 في الولايات المتحدة، اعتبارًا من 21 أغسطس، مستشهدة بالتحديات الاقتصادية. تظل موديلات وملحقات بلايستيشن 5 الأخرى دون تغيير.
09-09-2025
نفايات بلاستيكية تتحول إلى مادة آكلة للكربون على يد علماء دنماركيين
حوّل علماء دنماركيون ببراعة النفايات البلاستيكية إلى مادة قوية قادرة على امتصاص الكربون، مما يقدم حلاً جديداً لمكافحة التلوث وتغير المناخ.
29-05-2025
جوجل صور تحتفل بمرور 10 سنوات على إطلاقها مع أكثر من 9 تريليون صورة وفيديو
احتفلت جوجل صور بمرور 10 سنوات على إطلاقها، مع أكثر من 9 تريليون صورة وفيديو مخزنة، وقدمت ميزات جديدة مثل محرر الصور المعاد تصميمه وأكواد QR لمشاركة الألبومات.
29-09-2025
روبوت بشري يتقن الشقلبات الجانبية، مستعرضًا رشاقة متقدمة
يُظهر الروبوت البشري فورييه N1 رشاقة مبهرة بأداء الشقلبات الجانبية، مُبرزًا عتاده المتقدم وإمكانات برمجته مفتوحة المصدر للمطورين والباحثين.
18-06-2025
روبوت بشري مدعوم من NVIDIA يحدث ثورة في عمليات المصانع
كشفت شركتا Hexagon وNVIDIA عن AEON، وهو روبوت بشري مصمم لإحداث ثورة في عمليات المصانع بفضل الذكاء الاصطناعي المتقدم والتدريب القائم على المحاكاة أولاً، ويؤدي مهام تتراوح من التلاعب بالآلات إلى مسح الأصول.
29-09-2025
راي بان ميتا الجيل الثاني: أفضل النظارات الذكية بدون شاشة، ولكن هل تستحق الترقية؟
مراجعة شاملة لنظارات Ray-Ban Meta Gen 2 الذكية، تسلط الضوء على التحسينات في عمر البطارية وتسجيل الفيديو، مع مناقشة قيود Meta AI ومخاوف الخصوصية.
29-08-2025
تسريبات جهاز بلايستيشن المحمول تلمح إلى قاتل لـ ROG Ally X بمواصفات قوية وسعر أقل
تشير تسريبات جديدة إلى أن جهاز بلاي ستيشن المحمول القادم من سوني قد يتفوق على ROG Ally X بمعالج AMD APU قوي وتسعير تنافسي.
03-07-2025
انغمس: فيلم "الفك المفترس" يعود إلى دور العرض بمناسبة الذكرى الخمسين مع أول إصدار بتقنية 4DX على الإطلاق
تحتفل Jaws بالذكرى الخمسين لتأسيسها بإعادة إصدار في 4DX و D-Box لأول مرة، مما يوفر تجربة سينمائية غامرة.
02-10-2025
أثارت مايكروسوفت غضبًا بسبب الزيادات الكبيرة في أسعار Xbox Game Pass وإعادة تسمية المستويات المربكة
رفعت Microsoft أسعار Xbox Game Pass Ultimate و PC Game Pass بشكل ملحوظ، مع إعادة تسمية مستويات الاشتراك أيضًا، مما أدى إلى رد فعل عنيف واسع النطاق من العملاء وزيادة في عمليات الإلغاء.
15-10-2025
سامسونج تستعد للكشف عن سماعة الواقع المختلط 'مشروع موهان' الأسبوع المقبل
سامسونج تلمح رسميًا إلى إطلاق جهاز الواقع المختلط Project Moohan الأسبوع المقبل، والذي يعمل بمنصة Android XR الجديدة. تعرف على المزيد حول الجهاز القادم وتأثيره المحتمل على سوق الواقع المختلط.
20-05-2025
NVIDIA تطلق مشروع GR00T: نموذج AI مبتكر للروبوتات القابلة للتكيف بسرعة في الصناعة
NVIDIA تكشف عن مشروع GR00T، نموذج AI مبتكر للروبوتات القابلة للتكيف بسرعة في الصناعة، خلال Computex 2025.