يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

05-08-2025
يوتيوبر يُخضِع سامسونج جالكسي زد فولد 7 لـ 200 ألف طية في اختبار متانة قصوى
يجري أحد مستخدمي يوتيوب اختبار متانة قصوى على هاتف سامسونج جالكسي زد فولد 7، حيث يقوم بطيه 200 ألف مرة لتقييم مرونة مفصلته وشاشته.
26-05-2025
إطلاق "دانوب الأزرق" إلى الفضاء احتفالاً بعيد ميلاد شتراوس 200
احتفالاً بعيد ميلاد شتراوس 200، سيتم إرسال مقطوعة "دانوب الأزرق" إلى الفضاء، حيث ستُبث عبر إشارات راديوية، مما يفتح آفاق جديدة لاستكشاف الفضاء.
27-05-2025
آبل تدخل عالم النظارات الذكية: وداعًا للهواتف المحمولة كما نعرفها
آبل تستعد لإطلاق نظارات ذكية جديدة مزودة بالذكاء الاصطناعي وكاميرات مدمجة، مما قد يغير مفهوم الهواتف المحمولة كما نعرفها.
11-08-2025
روبوتات كندية تغزو الساحة الرياضية العالمية، تهدف إلى مستقبل أكثر فائدة
الروبوتات الكندية تتفوق في رياضات شبيهة بالأولمبياد ضمن كأس العالم للروبوتات، مما يدفع عجلة البحث لتطوير روبوتات بشرية عملية ذات تطبيقات في رعاية كبار السن والصناعة.
18-06-2025
شركات الروبوتات البشرية في الصين تقدم رواتب خيالية وسط صراع على مواهب الذكاء الاصطناعي
تدفع شركات الروبوتات البشرية الصينية للمهندسين ومواهب الذكاء الاصطناعي أكثر من ثلاثة أضعاف المتوسط الوطني بسبب نقص حاد في المواهب، مما يسلط الضوء على طلب القطاع المزدهر على المهارات المتخصصة.
18-07-2025
الأجهزة الذكية تمكن كبار السن من التقدم في العمر في المنزل، حسبما وجد استطلاع
يكشف استطلاع جديد أن الأجهزة الذكية التي تعمل بالذكاء الاصطناعي تساعد كبار السن على التقدم في العمر في المنزل، ولكن الشكوك حول المعلومات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي لا تزال قائمة.
17-07-2025
تشكيلة Pixel 10 المدعومة بالذكاء الاصطناعي من Google تظهر لأول مرة في 20 أغسطس
ستكشف Google عن سلسلة Pixel 10 و Pixel Watch 4 المدعومة بالذكاء الاصطناعي في 20 أغسطس في نيويورك، حيث ستعرض ميزات الذكاء الاصطناعي المتقدمة وعوامل الشكل الجديدة.
25-07-2025
ما وراء الزجاج السائل: الكشف عن الجواهر الخفية في macOS 26 تاكوما
استكشف الميزات الأقل شهرة في الإصدار التجريبي العام لنظام macOS 26 Tahoe، بما في ذلك التخصيص المحسن، ومساعد استرداد جديد، واختصارات آلية، وتشفير آمن كميًا.
24-06-2025
تطبيق Xbox للكمبيوتر يدمج الآن ألعاب Steam الخاصة بك
يتكامل تطبيق Xbox للكمبيوتر الشخصي الآن مع ألعاب Steam، بهدف أن يصبح مشغلًا عالميًا. تعكس هذه الخطوة استراتيجية Microsoft لتوسيع نظامها البيئي للألعاب عبر منصات الكمبيوتر الشخصي والأجهزة المحمولة والسحابة.
28-05-2025
استخدام صوت امرأة كمنبه قطارات بالذكاء الاصطناعي دون علمها
اكتشفت غايان بوتر، فنانة الصوت الشهيرة، أن صوتها قد تم استخدامه كمنبه للقطارات في اسكتلندا دون علمها، مما يثير قضايا حقوق الفنانين في عصر الذكاء الاصطناعي.
08-08-2025
اختراق جيميني: الباحثون يتحكمون بالمنازل الذكية عبر دعوات التقويم
نجح باحثون في اختراق Google Gemini AI، باستخدام دعوات التقويم للتحكم في أجهزة المنزل الذكي. تعرف على الثغرة الأمنية واستجابة جوجل.
14-08-2025
افتح أداة النسخ الاحتياطي السرية لجهاز الكمبيوتر الخاص بك: دليل لـ Windows Backup
اكتشف أداة النسخ الاحتياطي المخفية في نظامي التشغيل Windows 10 و 11. تعرّف على كيفية الوصول إليها واستخدامها وجدولة النسخ الاحتياطية لملفاتك المهمة، على الرغم من حالتها المهملة.
19-08-2025
مُقرض العملات المشفرة فيجر يتقدم بطلب طرح عام أولي وسط جهل عام واسع النطاق
تتقدم شركة فيجر للحلول التقنية، مقرضة البلوكتشين، بطلب للاكتتاب العام الأولي وسط الفهم المحدود للجمهور للعملات المشفرة، مسلطة الضوء على التطبيقات العملية والاندماج في التيار السائد.
15-07-2025
جروك يكشف النقاب عن رفقاء الذكاء الاصطناعي، بما في ذلك فتاة أنمي قوطية، وسط مخاوف تتعلق بالسلامة
يقدم روبوت الدردشة Grok AI الخاص بإيلون ماسك "رفقاء AI" جدد للمشتركين المتميزين، بما في ذلك فتاة أنمي قوطية، مما يثير تساؤلات حول علاقات الذكاء الاصطناعي والسلامة.
12-06-2025
ارتفاع درجة حرارة Pixel 6a: مخاوف من ارتفاع درجة الحرارة والسلامة تبتلي هاتف Google الاقتصادي
يواجه هاتف Google Pixel 6a مشكلات خطيرة في ارتفاع درجة الحرارة، حيث ورد أن بعض الأجهزة تذوب. وقد حذرت Google المستخدمين وقد تطبق تحديثًا للبرنامج لتقليل أداء البطارية، مما يثير مخاوف بشأن السلامة وسهولة الاستخدام على المدى الطويل.
14-08-2025
Vbot و EVE Energy يبرمان تحالفًا لبطاريات الروبوتات المتقدمة
تتعاون Vbot مع EVE Energy لتطوير بطاريات عالية الأداء للروبوتات، بهدف تعزيز قدرات الروبوتات عبر مختلف الصناعات باستخدام حلول طاقة متقدمة.