Anthropic və Ağ Ev arasında AI jailbreak böhranı

Ağ Ev Anthropic-dən Claude Fable 5-də bütün jailbreak boşluqlarını bağlamağı tələb edir. Ekspertlər isə xəbərdarlıq edir: AI guardrail-ləri tam keçilməz divar deyil, sadəcə müvəqqəti müdafiə ola bilər.

Ağ Ev Anthropic-ə çox çətin bir mesaj verir: Claude Fable 5 yenidən yayımlanacaqsa, jailbreak boşluqları bağlanmalıdır. Amma AI təhlükəsizliyi üzrə ekspertlər deyir ki, bu tələb kağız üzərində yaxşı səslənsə də, praktikada demək olar mümkün olmaya bilər.

Məsələ təkcə bir modelin səhvi deyil; söhbət süni intellektin qoruyucu baryerlərinin ümumiyyətlə nə qədər etibarlı olmasından gedir. Claude Fable 5 ətrafında yaranan gərginlik indi ABŞ administrasiyası ilə Anthropic arasında açıq texnoloji qarşıdurmaya çevrilir.

Ağ Ev Anthropic-dən bütün AI jailbreak-lərini bağlamağı istəyir: Bu, realdırmı?

Claude Fable 5 niyə dayandırıldı?

Wired-in məlumatına görə, Trump administrasiyası Claude Fable 5-in yenidən buraxılması üçün Anthropic-dən modeldəki təhlükəsizlik zəifliklərini ciddi şəkildə aradan qaldırmağı tələb edir. Model ötən həftə ixrac nəzarəti səbəbilə offline edilmişdi.

Əsas narahatlıq “jailbreak” adlanan üsuldur. Bu zaman istifadəçi xüsusi prompt-lar vasitəsilə modelin təhlükəsizlik məhdudiyyətlərini aşmağa çalışır.

Anthropic isə günlərdir bildirir ki, hökumətin narahatlığı şişirdilib və bu jailbreak-lərin real təsiri minimaldır. Şirkət bu mövqeyini bazar ertəsi Commerce Department və Office of the National Cyber Director ilə texniki görüşdə də təkrar edib.

NSA-nın rəyi məsələni dəyişdi

ABŞ rəsmiləri artıq mübahisənin “bu boşluqlar vacibdirmi?” mərhələsini keçdiyini düşünür. Çünki National Security Agency Claude Fable 5-də qoruyucu mexanizmlərin müəyyən yollarla deaktiv edilə bildiyi qənaətinə gəlib.

NSA-nın nəticəsinə görə, Claude Fable 5-də bəzi qoruyucu baryerləri aşmaq və Mythos modelinin kibertəhlükəsizlik, kimya və biologiya ilə bağlı imkanlarına çıxış əldə etmək mümkündür.

Bu isə administrasiyanın gözündə məsələni birbaşa Anthropic-in məsuliyyətinə çevirir. Rəsmilər hesab edir ki, dövlət qurumları bazara çıxan hər AI modelində hər mümkün jailbreak ssenarisini tək-tək izləyə bilməz.

Ağ Ev nə istəyir, Anthropic nə edə bilər?

Məlumata görə, administrasiya Anthropic-in təkcə Claude Fable 5-i yox, bütün qabaqcıl AI modellərini davamlı şəkildə test etməsini istəyir. Şirkət potensial jailbreak-ləri özü tapmalı və hökumətə əvvəlcədən bildirməlidir.

Bu yanaşma kağız üzərində məntiqli görünür: model bazara çıxmazdan əvvəl risklər aşkar edilsin, zərərli istifadə imkanları azaldılsın. Amma problem ondadır ki, AI sistemlərində “tam bağlanmış” təhlükəsizlik qapısı yaratmaq çox çətindir.

Müstəqil kibertəhlükəsizlik ekspertləri getdikcə daha çox bildirirlər ki, guardrail-lər yalnız müvəqqəti qoruma rolunu oynayır. Bacarıqlı istifadəçilər və gələcək AI modelləri bu məhdudiyyətləri aşmaq üçün yeni yollar tapa bilər.

AI təhlükəsizliyi üçün sərt reallıq

Bu hadisə süni intellekt sənayesində daha böyük sualı gündəmə gətirir: təhlükəli imkanları olan güclü modelləri necə nəzarətdə saxlamaq olar? Sadəcə prompt filtrləri və təhlükəsizlik mesajları kifayət etməyə bilər.

Anthropic kimi şirkətlər üçün problem ikiqatdır. Bir tərəfdən modellər daha ağıllı və faydalı olmalıdır, digər tərəfdən isə həmin güc yanlış istifadəçinin əlində riskə çevrilməməlidir.

Ağ Ev mövzu ilə bağlı şərh verməkdən imtina edib. Amma bu qarşıdurma göstərir ki, AI şirkətləri ilə dövlətlər arasında təhlükəsizlik qaydaları uğrunda mübarizə daha da sərtləşəcək.

Nəticə: Claude Fable 5 qalmaqalı göstərir ki, AI modellərində jailbreak-ləri tamamilə dayandırmaq istəyi vacibdir, amma texniki baxımdan bu, sadə “blokla və unut” problemi deyil.

Ağ Ev Anthropic-dən bütün AI jailbreak-lərini bağlamağı istəyir: Bu, realdırmı?

Claude Fable 5 niyə dayandırıldı?

NSA-nın rəyi məsələni dəyişdi

Ağ Ev nə istəyir, Anthropic nə edə bilər?

AI təhlükəsizliyi üçün sərt reallıq