يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

08-19 06:18

button icon

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

2025-10-14 03:04:33
آبل تي في+ تتخلى عن علامة الزائد، تعيد تسميتها إلى آبل تي في في تغيير كبير في خدمات البث
أعادت Apple TV+ تسميتها إلى Apple TV، موحدةً خدمة البث الخاصة بها مع جهاز التلفزيون الذكي والتطبيق الخاص بها. تأتي هذه الخطوة في الوقت الذي تحتفل فيه المنصة بالعديد من الجوائز لمحتواها الأصلي.
2025-10-06 05:12:40
أذهل الروبوت البشري أوبتيموس من تسلا المشاهدين بحركات كونغ فو مذهلة
روبوت تسلا البشري أوبتيموس يثير الإعجاب بعرض كونغ فو، مما يعرض التقدم في الرشاقة والحركة المدعومة بالذكاء الاصطناعي. اكتشف ماذا يعني هذا لمستقبل الروبوتات وطموحات تسلا القادمة.
2025-08-15 02:21:34
الروبوتات تتصدر المشهد: ألعاب الروبوتات البشرية العالمية 2025 تنطلق في بكين
افتتحت ألعاب الروبوتات البشرية العالمية 2025 في بكين، بمشاركة أكثر من 500 روبوت من 16 دولة، تعرض التعاون بين الإنسان والآلة من خلال عروض ثقافية وتكنولوجية.
2025-11-05 01:54:33
طابعة Kodak Mini 2 Retro تنخفض إلى أدنى سعر لها على الإطلاق في أمازون قبل الجمعة السوداء
اكتشف السعر المنخفض القياسي على طابعة الصور Kodak Mini 2 Retro Bundle في أمازون، والتي تتضمن 38 ورقة، في الوقت المناسب لعروض الجمعة السوداء.
2025-09-30 03:20:33
ابتكارات الروبوتات في معهد KAIST تحدث ثورة في الصناعات الكورية
يتم نشر روبوتات KAIST المتقدمة في أحواض بناء السفن في كوريا الجنوبية ومنطقة جانجنام، لعرض الابتكارات في الأتمتة الصناعية والخدمات الحضرية.
2025-09-25 03:56:30
محاكي الطيران من مايكروسوفت 2024 يحلق إلى PS5، ويظهر لأول مرة في State of Play مع دعم PSVR2
مايكروسوفت فلايت سيميوليتور 2024 قادمة رسميًا إلى بلايستيشن 5، مع الإعلان عن دعم PSVR2 خلال ظهورها الأول في State of Play. تعرف على المزيد حول الإصدار القادم.
2025-11-06 03:30:34
شانلينغ EC زيرو AKM: لمسة عصرية على مشغل الأقراص المدمجة المحمول
شانلينغ EC زيرو AKM: لمسة عصرية على مشغل الأقراص المدمجة المحمول
2025-08-27 02:56:56
يربط سبوتيفاي المستخدمين بميزة رسائل جديدة داخل التطبيق لتوصيات الموسيقى
تطرح سبوتيفاي ميزة المراسلة داخل التطبيق للمستخدمين لمشاركة توصيات الموسيقى والبودكاست والكتب الصوتية مع الأصدقاء، مما يعزز الروابط الاجتماعية داخل منصة البث.
2025-05-22 03:06:47
بكتيريا غير مسبوقة في محطة الفضاء قد تكون سلالة فريدة من نوعها
اكتشاف بكتيريا جديدة في محطة الفضاء الصينية قد تكون سلالة فريدة من نوعها، مما يفتح آفاق جديدة لفهم الحياة الميكروبية في الفضاء.
2025-11-12 02:16:05
قم بترقية ألعابك: شاشة محمولة بأسعار معقولة مقاس 15 بوصة لجهاز Nintendo Switch والمزيد
اكتشف الشاشة المحمولة MNN مقاس 15.6 بوصة، متوفرة الآن بسعر 58 دولارًا. عزز تجربة لعب Nintendo Switch الخاصة بك بدقة Full HD، واتصال USB-C سهل، وتصميم نحيف ومحمول.
2025-05-29 03:26:50
هجوم خبيث يستهدف آلاف أجهزة توجيه Asus
آلاف أجهزة توجيه Asus تتعرض لهجوم خبيث يتمثل في وجود أبواب خلفية مستمرة، مما يهدد أمان الشبكات المنزلية.
2025-08-11 02:35:12
ثورة الروبوتات في الصين: دفعة وطنية شاملة للهيمنة على الروبوتات الشبيهة بالبشر
استكشف استراتيجية الصين الشاملة "للأمة بأكملها" للسيطرة على سوق الروبوتات العالمي، مع التركيز على الروبوتات البشرية، والتقدم التكنولوجي، والدور الحاسم لدمج قطاعي السيارات الكهربائية والتكنولوجيا.
2025-09-26 03:46:33
طموحات ستارلينك المدارية لـ SpaceX قد تعطل المجال الجوي لفلوريدا
خطط سبيس إكس الطموحة لرحلات ستارشيب المدارية تتضمن مسارًا مقترحًا من شأنه أن يحلق مباشرة فوق فلوريدا، مما يثير مخاوف بشأن حركة الملاحة الجوية والسلامة.
2025-10-15 02:51:34
إنفيديا تكشف عن حاسوب مكتبي قوي للذكاء الاصطناعي: حاسوب DGX Spark المكتبي
تطلق Nvidia جهاز DGX Spark، وهو جهاز كمبيوتر مكتبي للذكاء الاصطناعي بسعر 4000 دولار، بقدرة حوسبة بيتا فلوب وذاكرة بسعة 128 جيجابايت، مما يتيح تشغيل نماذج الذكاء الاصطناعي الكبيرة محليًا.
2025-07-21 03:20:53
عودة كومودور المحفوفة بالمخاطر: هل يمكن للحنين إلى الماضي أن يدعم حقبة جديدة؟
يحاول كريستيان سيمبسون إحياء علامة كومودور التجارية الشهيرة، بإطلاق جهاز كومودور 64 ألتميت. هل يمكن للحنين إلى الماضي وشغف المجتمع التغلب على تحديات السوق وتجزئة الملكية؟