يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

04-09-2025
أحدث جهاز Chromebook Plus من أيسر يسلط الضوء على أزمة هوية المنصة
يسلط أحدث جهاز Chromebook Plus Spin 514 من أيسر الضوء على صراع المنصة للحفاظ على أهميتها في السوق الفاخرة، بتقديمه عتادًا متواضعًا بسعر باهظ.
02-09-2025
UBTech Robotics تؤمن خط ائتمان بقيمة مليار دولار من Infini Capital لتمويل التوسع العالمي
حصلت شركة يو بي تيك روبوتيكس الصينية لتصنيع الروبوتات الشبيهة بالبشر على خط ائتمان بقيمة مليار دولار من إنفيني كابيتال لتمويل توسيع الإنتاج والمشاريع المشتركة الدولية، بما في ذلك في الشرق الأوسط.
03-07-2025
مصنع هيونداي في جورجيا سيصبح رائداً في نشر روبوت أطلس البشري
ستقوم شركة Hyundai Motor بنشر روبوت Atlas البشري التابع لشركة Boston Dynamics في مصنع السيارات الكهربائية التابع لها في جورجيا في أكتوبر لإجراء أول تجربة ميدانية له، مما يمثل خطوة مهمة في أتمتة التصنيع.
27-08-2025
يوتيوب تتصدى لرد فعل عنيف من المبدعين بسبب تعديلات الفيديو المزعومة بالذكاء الاصطناعي
تتصدى يوتيوب لمخاوف المبدعين بشأن تعديل الذكاء الاصطناعي لمقاطع فيديو Shorts، وتعلن عن خطط لميزة إلغاء الاشتراك وسط نقاشات حول الشفافية والأصالة.
28-05-2025
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع في نظامنا الشمسي.
23-05-2025
مايكروسوفت تحول ويندوز إلى منصة ذكية للويب الجديد
مايكروسوفت تعلن عن تحول ويندوز إلى منصة ذكية، مع إدخال بروتوكول جديد وأدوات مبتكرة لتعزيز تجربة المستخدم في عصر الذكاء الاصطناعي.
30-05-2025
Hugging Face تكشف عن روبوتين بشريين جديدين: HopeJR وReachy Mini
كشفت Hugging Face عن روبوتين بشريين جديدين، HopeJR وReachy Mini، مما يعزز التزامها بالروبوتات مفتوحة المصدر وبأسعار معقولة.
13-06-2025
بكين تكشف النقاب عن أول متجر 4S في العالم للروبوتات الشبيهة بالبشر
تستعد بكين لافتتاح أول متجر 4S في العالم للروبوتات البشرية خلال المؤتمر العالمي للروبوتات 2025، والذي سيجمع بين المبيعات والخدمة وقطع الغيار وملاحظات العملاء لإحداث ثورة في الصناعة.
21-07-2025
هاتف Apple القابل للطي: ظهور غير تقليدي متوقع في عام 2025
من المقرر أن تطلق Apple أول هاتف iPhone قابل للطي في عام 2025، مع ظهور "غير معهود من Apple". تستكشف هذه المقالة الآثار المترتبة على هذا الجهاز الجديد وابتكارات Apple القادمة الأخرى.
30-09-2025
أحدث ثورة الذكاء الاصطناعي من Microsoft في إنشاء المستندات في Word و Excel
تعمل ميزة "وضع الوكيل" الجديدة المدعومة بالذكاء الاصطناعي من Microsoft في Word و Excel على تبسيط إنشاء المستندات، مما يسمح للمستخدمين بإنشاء محتوى احترافي باستخدام مطالبات اللغة الطبيعية.
09-09-2025
سوق تحرير الجينوم في الشرق الأوسط مهيأ لنمو كبير
استكشف سوق تحرير الجينوم المزدهر في الشرق الأوسط، والذي من المتوقع أن يصل إلى 668.6 مليون دولار أمريكي بحلول عام 2033، مدفوعًا بتقنية كريسبر، والمبادرات الوطنية للجينوم، وتزايد الاستثمارات في الرعاية الصحية.
04-09-2025
سامسونج تطلق مكبرات صوت تاور جديدة لتجربة حفلات لا مثيل لها
تكشف سامسونج عن مكبرات الصوت الجديدة من سلسلة Sound Tower، طرازيها ST50F و ST40F، في معرض IFA 2025، والتي تتميز بصوت محسن، وإضاءة قابلة للتخصيص، وقابلية للحمل لعشاق الحفلات.
18-09-2025
جوجل تكشف عن إكسسوار "سوار المعصم الحبل" لهواتف بكسل، على خطى آبل
تطلق جوجل إكسسوار "حبل المعصم" لهواتف بكسل، وهو حبل من البوليستر مع حلقة تسلق، بسعر 7 دولارات. تعرف على تصميمه، توافقه، وكيف يقارن بعروض أبل.
18-08-2025
نظارات ميتا للواقع المعزز 'هايبرنوفا' تستعد لظهور أرخص
من المتوقع أن تُطلق نظارات الواقع المعزز "هايبرنوفا" القادمة من ميتا بسعر أقل يبلغ حوالي 800 دولار، مما قد يجعل تقنية الواقع المعزز في متناول المستهلكين بشكل أكبر.
23-07-2025
مايكروسوفت تكشف النقاب عن Surface Laptop 5G للأعمال: قوة واتصال أثناء التنقل
تُزيح Microsoft الستار عن Surface Laptop 5G للأعمال، الذي يتميز بمعالجات Intel Core Ultra (السلسلة 2)، ووحدة معالجة عصبية قوية (NPU)، واتصال 5G سلس، ويبدأ شحنه في 26 أغسطس.
04-06-2025
معركة الروبوتات: روبوتات Unitree G1 الشبيهة بالبشر تتصادم في بطولة ملاكمة ملحمية
اكتشف عالم ملاكمة الروبوتات البشرية المثير مع أبرز أحداث معركة Unitree G1 Battle Royale. تعرف على التطورات التكنولوجية والقيمة الترفيهية لهذه الرياضة الناشئة.