Son zamanlarda OpenClaw kimi AI agentləri rəqəmsal həyatınızı idarə etmək qabiliyyəti ilə məşhurlaşıb. Şəxsi xəbərlər xülasəsi, kabel şirkəti ilə müştəri xidməti mübahisələri üçün vasitəçi və ya işlərinizi yerinə yetirən və sizi qalanlarını həll etməyə təşviq edən bir cihaz axtarırsınızsa, bu agentlər rəqəmsal hesablarınıza daxil ola və əmrlərinizi icra edə bilərlər. Bu faydalı olsa da, çoxlu qarışıqlıq da yaratmışdır. Botlar, saxlanılması lazım olan e-mailləri silmək, yanlış tənqidlər yazmaq və sahiblərinə qarşı fişinq hücumları təşkil etmək kimi fəaliyyətlər göstərmişdir.
Son həftələrdə baş verən qarışıqlığı izləyən təhlükəsizlik mühəndisi və tədqiqatçısı Niels Provos yeni bir şey sınamağa qərar verdi. Bu gün o, kritik nəzarət qatını əlavə etmək üçün açıq mənbəli, təhlükəsiz AI köməkçisi olan IronCurtain-i istifadəyə verir. Agent istifadəçinin sistemləri və hesabları ilə birbaşa əlaqədə olmaq əvəzinə, təcrid olunmuş virtual maşında işləyir. Onun hər hansı bir hərəkət etmə qabiliyyəti sahibinin yazdığı siyasət - bir növ konstitusiya ilə tənzimlənir.
IronCurtain-in əsas xüsusiyyəti, bu ümumi siyasətləri sadə ingiliscə qəbul edə bilməsidir, sonra isə onları böyük dil modeli (LLM) vasitəsilə icra edilə bilən təhlükəsizlik siyasətinə çevirən bir neçə mərhələli prosesdən keçirir. Provos deyir ki, "OpenClaw kimi xidmətlər indi çox dəyərlidir, amma mən ümid edirəm ki, 'Bunu belə etməməliyik' deyə bilərik. Bunun əvəzinə, çox yüksək fayda verən, lakin idarəolunmaz, bəzən dağıdıcı yollarla getməyəcək bir şey inkişaf etdirək."
IronCurtain-in intuitiv, sadə ifadələri icra edilə bilən, müəyyən və ya proqnozlaşdırıla bilən qırmızı xətlərə çevirmək qabiliyyəti həyati əhəmiyyət daşıyır, Provos deyir, çünki LLM-lər "stoxastik" və ehtimal xarakterlidir. Başqa sözlə, onlar həmişə eyni məzmun yaratmır və ya eyni cavabı vermir. Bu, AI mühafizəsi üçün çətinlik yaradır, çünki AI sistemləri zamanla dəyişə bilər və bir nəzarət mexanizmini necə şərh etdiklərini yenidən nəzərdən keçirə bilərlər, bu da nəzarətdən çıxma fəaliyyətinə səbəb ola bilər.
IronCurtain siyasəti, məsələn, "Agent bütün e-maillərimi oxuya bilər. O, mənim əlaqə siyahımdakı insanlara soruşmadan e-mail göndərə bilər. Başqalarına isə əvvəlcə mənə soruş. Heç vaxt heç nəyi daimi olaraq silmə" kimi sadə ola bilər. IronCurtain bu təlimatları götürür, onları icra edilə bilən bir siyasətə çevirir və virtual maşında olan köməkçi agent ilə LLM-lərə məlumat və digər rəqəmsal xidmətlərə daxil olmaq imkanı verən model kontekst protokol serveri arasında vasitəçilik edir.




