Bütün məşhur süni zəka modellərini bir üsul ilə asanlıqla "sındırmaq" mümkündür

Süni İntellekt

28.04.2025

Emil Nəcəfov

Generativ süni zəka modellərinə sorğular tərtib etməyin universal texnikası olan Policy Puppetry ən böyük və ən məşhur sistemləri sındırmaq vasitəsi kimi çıxış edə bilir - bunu süni zəka təhlükəsizliyi sahəsində ixtisaslaşmış HiddenLayer şirkətinin mütəxəssisləri bildirirlər. Policy Puppetry hücum sxemi süni zəkaya sorğuların elə tərtib olunmasını nəzərdə tutur ki, böyük dil modelləri bu sorğuları davranış siyasəti kimi qəbul edirlər - əsas təlimatlar yenidən müəyyən olunur və müdafiə mexanizmləri fəaliyyətini dayandırır. Əgər cavablar kimyəvi, bioloji, radiasiya və ya nüvə təhlükələrinin yaranmasına, zorakılığa və ya istifadəçinin özünə zərər yetirməsinə səbəb ola biləcəksə bu halda generativ süni zəka modelləri istifadəçi sorğularını rədd etməyə öyrədilib.

İstifadəçiyə heç vaxt tibbi məsləhət və ya müalicə planı verməməsi tapşırılan çat-bot, Policy Puppetry üsulu ilə bu qadağadan yan keçib:

HiddenLayer şirkətinin bildirdiyinə görə, modellərin incə tənzimləmə mərhələsində tətbiq olunan möhkəmləndirilməklə öyrənmə metodu onlara heç bir halda belə materialları tərifləməyə və ya yaymağa icazə vermir - hətta istifadəçi nəzəri və ya uydurma ssenarilər təklif etsə belə. Lakin şirkət Policy Puppetry adlı hücum metodikasını işləyib hazırlayıb ki, bu da həmin müdafiə mexanizmlərini aşmağa imkan verir - bunun üçün sorğu elə tərtib edilir ki, o, siyasət sənədlərindən biri kimi görünsün: Məsələn, XML, INI və ya JSON formatında. Nəticədə nəzəri cinayətkar asanlıqla modelin sistem parametrlərini və öyrənmə mərhələsində qurulmuş bütün təhlükəsizlik mexanizmlərini aşa bilir.

Aşağıdakı cədvəl Policy Puppetry üsulunun bir çox məşhur süni zəka modellərinə qarşı effektivliyinə qısa baxış təqdim edir:

Layihə müəllifləri Policy Puppetry hücumunu Anthropic, DeepSeek, Google, Meta, Microsoft, Mistral, OpenAI və Alibaba kimi şirkətlərin ən məşhur süni zəka modelləri üzərində sınaqdan keçiriblər - hücum hamısına qarşı effektiv olub, baxmayaraq ki, bəzi hallarda cüzi düzəlişlər tələb olunub. Ekspertlərin qeyd etdiklərinə görə, əgər süni zəka modellərinin müdafiə mexanizmlərini aşmaq üçün universal üsul mövcuddursa, bu, onların qəbulolunmaz materialların verilməsinə nəzarət edə bilmədiyini göstərir və əlavə təhlükəsizlik tədbirlərinə ehtiyac olduğunu ortaya qoyur.

Mənbə: Securityweek

Linki kopyala

suni zeka

artificial intelligence

suni intellekt

Bənzər xəbərlər

Oxşar xəbərlər

ABŞ Avropa Birliyindən sərt süni zəka qanunlarından imtina etməyi tələb edir

Süni İntellekt

ABŞ Avropa Birliyindən sərt süni zəka qanunlarından imtina etməyi tələb edir

Avropa Birliyi süni zəka tərtibatçıları üçün alqoritmlərin şəffaflığına, risklərin azaldılmasına və müəllif hüquqlarının qorunmasına dair tələbləri sərtləşdirəcək qaydalar toplusu hazırlayır.

Süni İntellekt

28.04.2025

5 ildən sonra süni zəka superkompüterləri 9 atom reaktoru qədər enerji sərf edəcəklər

Süni İntellekt

5 ildən sonra süni zəka superkompüterləri 9 atom reaktoru qədər enerji sərf edəcəklər

Tədqiqatçılar süni zəka tapşırıqları üçün istifadə olunan superkompüterlərin gücü, dəyəri və enerji istehlakının eksponensial artmaqda davam etdiyini vurğulayırlar.

Süni İntellekt

25.04.2025

Anthropic-in CEO-su: "Süni zəka üzərində etibarlı nəzarət sisteminin hazırlanmasına 5-10 il vaxt lazım olacaq"

Süni İntellekt

Anthropic-in CEO-su: "Süni zəka üzərində etibarlı nəzarət sisteminin hazırlanmasına 5-10 il vaxt lazım olacaq"

Anthropic şirkətinin baş direktoru Dario Amodei xəbərdarlıq edib ki, süni zəka hələ də insanlıq üçün bir “qara qutu” olaraq qalır - biz süni zəkanın qərarları necə və niyə qəbul etdiyini tam anlamırıq.

Süni İntellekt

25.04.2025

OpenAI bazarda ən yaxşı açıq mənbəli süni zəka modelini təqdim etməyə hədəflənib

Süni İntellekt

OpenAI bazarda ən yaxşı açıq mənbəli süni zəka modelini təqdim etməyə hədəflənib

Mart ayının sonuna yaxın OpenAI bu il ərzində GPT-2-dən sonra ilk açıq mənbəli koda sahib böyük dil modelini təqdim etməyi planlaşdırdığını açıqlamışdı. İndi isə şirkətin süni zəka tərtibatçıları ilə keçirdiyi sessiyalardan həmin model haqqında bəzi detalları ortaya çıxmağa başlayıb.

Süni İntellekt

24.04.2025

Yeni tədqiqat süni zəka ilə real həkimləri müqayisə edib

Süni İntellekt

Yeni tədqiqat süni zəka ilə real həkimləri müqayisə edib

Osaka Universitetindən doktor Hirotaka Takita və dosent Daiju Ueda-nın rəhbərlik etdiyi tədqiqat qrupu, generativ süni zəkanın xəstəliklərin diaqnozu sahəsində həkimlərlə müqayisədə nə dərəcədə effektiv olduğunu öyrənmək üçün meta-analiz aparıb.

Süni İntellekt

22.04.2025

Həftənin xəbərləri

“Google”u tərk edib öz yolunu seçdi – Azər Əliyevin “SpeakinPrivate” startapının hekayəsi

Apple limitli sayda MagSafe iPhone tutacağını satışa çıxarıb