أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي

وأوضحت الشركة في ورقة بحثية أن الميزة الجديدة عبارة عن طبقة حماية تعمل فوق نماذج اللغة الكبيرة، مثل نموذج كلاود التابع لها، ويتيح هذا النظام مراقبة المدخلات والمخرجات، لمنع إنتاج أي محتوى غير آمن.
يأتي هذا التطوير وسط تزايد المخاوف من ظاهرة "اختراق الذكاء الاصطناعي" ، والتي تتضمن محاولات لاستغلال النماذج لإنتاج معلومات غير قانونية أو خطرة، مثل إرشادات تصنيع الأسلحة الكيميائية. ومع تزايد هذه التهديدات، تتسابق الشركات لإيجاد حلول تحمي نماذجها، مما يساعدها على تجنب التدقيق التنظيمي، وكسب ثقة المؤسسات.
وقال مرينانك شارما، أحد أعضاء الفريق التقني في أنثروبيك: "إن الدافع الرئيسي وراء تطوير النظام كان التعامل مع الأخطار الشديدة، مثل تصنيع الأسلحة الكيميائية، لكن أهم ميزة هي القدرة على التكيف والاستجابة السريعة".
ومع أن أنثروبيك لم تدمج هذه التقنية في نماذج كلاود الحالية، فإنها أشارت إلى احتمال استخدامها مستقبلا عند إطلاق نماذج أكثر تطورا وأعلى خطورة.
ويعتمد النظام الجديد على "دستور" من القواعد التي تحدد المحتوى المسموح والمحظور، ويمكن تعديله للتعامل مع أنواع مختلفة من المواد الخطرة، وتستخدم طرق متنوعة لاختراق النماذج، مثل إعادة صياغة الطلبات بأسلوب غير مألوف، أو مطالبة النموذج بالتصرف كشخصية خيالية لتجاوز قيود الأمان.
في رفض أكثر من خ٩٥بالمية من محاولات الاختراق عند تشغيل التقنية الأمنية الجديدة، مقارنة بنسبة قدرها ١٤ بالمية فقط عند عدم تفعيلها.

نظرا للصعوبات الاقتصادية التي رافقت الجائحة وأعقبتها اضطررنا لإيقاف أقسام اللغات الأجنبية على أمل ان تعود لاحقا بعد ان تتغير الظروف

ترجمات ودراسات

تشارلز ليستر : امكانية رفع العقوبات عن سوريا شبه معدومة

الجهات الأربع

سائحات من إسبانيا وأمريكا الجنوبية يجتمعن حول مائدة إفطار تركية

آبل تؤجل إجراء تحسينات الذكاء الاصطناعي على مساعدها الصوتي سيري

كوبرنيكوس: ثالث أحرّ شهر فبراير على مستوى العالم

إيطاليا: منح دراسية للشباب الأجانب قريبا وتركيز على أفريقيا

المخاض السوري و"همروجة" مؤتمر الحوار الوطني علي العبدالله

بَين ثورتَي 1925 و2011: كم تساوي سوريا؟

التطييف وبناء الوطنية السورية

فلول الأسد: التجربة المرة

( كيف سيُسجّل اسم أحمد الشرع في التاريخ؟)

خالد الأحمد: المستشار المنفي

ما الذي تريده إسرائيل من سوريا الجديدة؟

دروز سوريا ومخيّلة نتنياهو: عطب المخلّفات

الجرح الاوربي ...عميق

في دمشق نسيتُ الفوتوغراف

بعد اجتماع أنقرة.. هل تدفع التهديدات الإسرائيلية بتقارب روسي سوري من جديد؟

هذا التصعيد الإسرائيلي على سورية

تساؤلات حول المستقبل السياسي في سورية

الدين للجميع والوَطن للشعب

الطائفة المظلومة في سوريا

عندما تعوّض إسرائيل خسارتها نظام الاسد

لا تنخدعوا بأوهام تجربة نيلسون مانديلا

ماكس فيبر وسوريا الجديدة

شهية الاستيراد تغرق السوق السورية... وتبدد الدولار

المخلوع بشَّار الأسد ومستقبل شبِّيحته في المرحلة الانتقاليَّة

أروقة التراث

البارونة آن بلانت : عاشقة الخيول العربية والحياة البدوية

أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي

تيك توك تطلق مزايا جديدة لحماية المراهقين وتعزيز الإشراف العائلي - 12/03/2025

سائحات من إسبانيا وأمريكا الجنوبية يجتمعن حول مائدة إفطار تركية - 10/03/2025

آبل تؤجل إجراء تحسينات الذكاء الاصطناعي على مساعدها الصوتي سيري - 09/03/2025

كوبرنيكوس: ثالث أحرّ شهر فبراير على مستوى العالم - 06/03/2025

إيطاليا: منح دراسية للشباب الأجانب قريبا وتركيز على أفريقيا - 05/03/2025