نظرا للصعوبات الاقتصادية التي رافقت الجائحة وأعقبتها اضطررنا لإيقاف أقسام اللغات الأجنبية على أمل ان تعود لاحقا بعد ان تتغير الظروف

الهدهد: صحيفة اليكترونية عربية بخمس لغات عالمية
الهدهد: صحيفة اليكترونية عربية بأربع لغات عالمية
Rss
Facebook
Twitter
App Store
Mobile



عيون المقالات

ابتكار الجماعة السياسية

31/01/2025 - مضر رياض الدبس

ترامب يرسم خارطة جديدة للعالم

31/01/2025 - ‎علاء الخطيب

هل صحيح أن الثورة خلصت

16/01/2025 - وائل الشيخ أمين

هونداية في المالديف

13/01/2025 - عروة خليفة

من دمشق... سقط المشروع الإيراني

08/01/2025 - عالية منصور

من بطاركة العرب إلى بطرك كرسي الأسد!

06/01/2025 - المحامي أدوار حشوة

جماعة ماذا لو ...؟ وجماعة وماذا عن ....؟

01/01/2025 - د.محيي الدين اللاذقاني


أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي




واشنطن - طورت شركة أنثروبيك الناشئة في مجال الذكاء الاصطناعي تقنية "المصنفات الدستورية" الجديدة، والتي تهدف إلى منع المستخدمين من إساءة استخدام نماذجها، واستخراج محتوى ضار منها، في خطوة تعكس تسابق كبرى الشركات التقنية لتعزيز معايير الأمان في هذا المجال المتطور


 

وأوضحت الشركة في ورقة بحثية أن الميزة الجديدة عبارة عن طبقة حماية تعمل فوق نماذج اللغة الكبيرة، مثل نموذج  كلاود التابع لها، ويتيح هذا النظام مراقبة المدخلات والمخرجات، لمنع إنتاج أي محتوى غير آمن.
يأتي هذا التطوير وسط تزايد المخاوف من ظاهرة "اختراق الذكاء الاصطناعي" ، والتي تتضمن محاولات لاستغلال النماذج لإنتاج معلومات غير قانونية أو خطرة، مثل إرشادات تصنيع الأسلحة الكيميائية. ومع تزايد هذه التهديدات، تتسابق الشركات لإيجاد حلول تحمي نماذجها، مما يساعدها على تجنب التدقيق التنظيمي، وكسب ثقة المؤسسات.
وقال مرينانك شارما، أحد أعضاء الفريق التقني في أنثروبيك: "إن الدافع الرئيسي وراء تطوير النظام كان التعامل مع الأخطار الشديدة، مثل تصنيع الأسلحة الكيميائية، لكن أهم ميزة هي القدرة على التكيف والاستجابة السريعة".
ومع أن أنثروبيك لم تدمج هذه التقنية في نماذج  كلاود الحالية، فإنها أشارت إلى احتمال استخدامها مستقبلا عند إطلاق نماذج أكثر تطورا وأعلى خطورة.
ويعتمد النظام الجديد على "دستور" من القواعد التي تحدد المحتوى المسموح والمحظور، ويمكن تعديله للتعامل مع أنواع مختلفة من المواد الخطرة، وتستخدم طرق متنوعة لاختراق النماذج، مثل إعادة صياغة الطلبات بأسلوب غير مألوف، أو مطالبة النموذج بالتصرف كشخصية خيالية لتجاوز قيود الأمان.
  في رفض أكثر من  خ٩٥بالمية من محاولات الاختراق عند تشغيل التقنية الأمنية الجديدة، مقارنة بنسبة قدرها  ١٤ بالمية فقط عند عدم تفعيلها.

وكالات- قنا
الثلاثاء 4 فبراير 2025