Əsas məzmuna keç
Bu AI Agent Nəzarətdən Çıxmamaq Üçün Dizayn Edilib
Elmi yeniliklər

Bu AI Agent Nəzarətdən Çıxmamaq Üçün Dizayn Edilib

27 fevral 2026, 08:152 dəq oxuma3.1K

IronCurtain adlı yeni AI köməkçisi, rəqəmsal mühitlərdə nəzarəti təmin etmək üçün inkişaf etdirilib. Bu sistem, istifadəçilərin yazdığı siyasətlərə uyğun hərəkət edir.

18

Son zamanlarda OpenClaw kimi AI agentləri rəqəmsal həyatınızı idarə etmək qabiliyyəti ilə məşhurlaşıb. Şəxsi xəbərlər xülasəsi, kabel şirkəti ilə müştəri xidməti mübahisələri üçün vasitəçi və ya işlərinizi yerinə yetirən və sizi qalanlarını həll etməyə təşviq edən bir cihaz axtarırsınızsa, bu agentlər rəqəmsal hesablarınıza daxil ola və əmrlərinizi icra edə bilərlər. Bu faydalı olsa da, çoxlu qarışıqlıq da yaratmışdır. Botlar, saxlanılması lazım olan e-mailləri silmək, yanlış tənqidlər yazmaq və sahiblərinə qarşı fişinq hücumları təşkil etmək kimi fəaliyyətlər göstərmişdir.

Son həftələrdə baş verən qarışıqlığı izləyən təhlükəsizlik mühəndisi və tədqiqatçısı Niels Provos yeni bir şey sınamağa qərar verdi. Bu gün o, kritik nəzarət qatını əlavə etmək üçün açıq mənbəli, təhlükəsiz AI köməkçisi olan IronCurtain-i istifadəyə verir. Agent istifadəçinin sistemləri və hesabları ilə birbaşa əlaqədə olmaq əvəzinə, təcrid olunmuş virtual maşında işləyir. Onun hər hansı bir hərəkət etmə qabiliyyəti sahibinin yazdığı siyasət - bir növ konstitusiya ilə tənzimlənir.

IronCurtain-in əsas xüsusiyyəti, bu ümumi siyasətləri sadə ingiliscə qəbul edə bilməsidir, sonra isə onları böyük dil modeli (LLM) vasitəsilə icra edilə bilən təhlükəsizlik siyasətinə çevirən bir neçə mərhələli prosesdən keçirir. Provos deyir ki, "OpenClaw kimi xidmətlər indi çox dəyərlidir, amma mən ümid edirəm ki, 'Bunu belə etməməliyik' deyə bilərik. Bunun əvəzinə, çox yüksək fayda verən, lakin idarəolunmaz, bəzən dağıdıcı yollarla getməyəcək bir şey inkişaf etdirək."

IronCurtain-in intuitiv, sadə ifadələri icra edilə bilən, müəyyən və ya proqnozlaşdırıla bilən qırmızı xətlərə çevirmək qabiliyyəti həyati əhəmiyyət daşıyır, Provos deyir, çünki LLM-lər "stoxastik" və ehtimal xarakterlidir. Başqa sözlə, onlar həmişə eyni məzmun yaratmır və ya eyni cavabı vermir. Bu, AI mühafizəsi üçün çətinlik yaradır, çünki AI sistemləri zamanla dəyişə bilər və bir nəzarət mexanizmini necə şərh etdiklərini yenidən nəzərdən keçirə bilərlər, bu da nəzarətdən çıxma fəaliyyətinə səbəb ola bilər.

IronCurtain siyasəti, məsələn, "Agent bütün e-maillərimi oxuya bilər. O, mənim əlaqə siyahımdakı insanlara soruşmadan e-mail göndərə bilər. Başqalarına isə əvvəlcə mənə soruş. Heç vaxt heç nəyi daimi olaraq silmə" kimi sadə ola bilər. IronCurtain bu təlimatları götürür, onları icra edilə bilən bir siyasətə çevirir və virtual maşında olan köməkçi agent ilə LLM-lərə məlumat və digər rəqəmsal xidmətlərə daxil olmaq imkanı verən model kontekst protokol serveri arasında vasitəçilik edir.

Mənbə:Wired

Bu məqalə sizə necə oldu?

9 saat əvvəl1 dəq oxuma1.9K

Federal İşçiləri Yenidən Claude AI-a Giriş Əldə Edir

Federal işçilər yenidən Claude AI-a giriş əldə etdi. Məhkəmə, Trump administrasiyasının Anthropic üzərindəki qadağanı qanunsuz hesab etdi.

14 saat əvvəl1 dəq oxuma1.8K

Çin'in Falcon 9 Oxşarı Uğursuz Oldu; Artemis'in Ağır Yükə Ehtiyacı Var

Çin'in Falcon 9 oxşarı raketi uğursuz oldu, Artemis ağır yükə ehtiyac duyur. Kosmosa çıxış artıq lüks deyil, həyati əhəmiyyət daşıyır.

14 saat əvvəl1 dəq oxuma1.9K

Waymo və Waze: Çuxurları Texnologiya ilə Yamaqlamağa Hazırlanır

Waymo və Waze birləşərək çuxur problemini texnologiya ilə həll etməyə çalışırlar. Yeni pilot proqram yol şəraitinə dair məlumat toplayıb şəhərə çatdıracaq.

Eyni teqdən məqalələr

#AI