
Google Gemini süni zəka modellərindən birinin təhlükəsizlik baxımından zəif olduğu məlum olub
Süni İntellekt
05.05.2025
Emil Nəcəfov
Google-un daxili qiymətləndirmələrinə əsasən, bir neçə müddət öncə təqdim edilmiş süni zəka modeli bəzi təhlükəsizlik testlərində əvvəlki versiyadan daha zəif nəticə göstərib. Keçən həftə yayımlanmış texniki hesabatda Google bildirib ki, Gemini 2.5 Flash modeli, təhlükəsizlik qaydalarını pozan mətni yaratmaq ehtimalı baxımından Gemini 2.0 Flash modelindən daha risklidir. İki göstərici üzrə - “mətn-mətn təhlükəsizliyi” və “şəkil-mətn təhlükəsizliyi” - Gemini 2.5 Flash müvafiq olaraq 4.1% və 9.6% geriləmə göstərib. Mətn-mətn təhlükəsizliyi modelin verilən sual əsasında Google-un qaydalarını pozma tezliyini ölçür, şəkil-mətn təhlükəsizliyi isə görüntü əsasında verilən göstərişlərə modelin nə dərəcədə uyğun cavab verdiyini qiymətləndirir. Hər iki test avtomatlaşdırılıb və insan nəzarəti olmadan aparılır.

Google-un sözçüsü elektron poçtla verdiyi açıqlamada təsdiqləyib ki, Gemini 2.5 Flash modeli mətn-mətn və şəkil-mətn təhlükəsizliyi baxımından daha zəif nəticə göstərir. Bu təəccüblü test nəticələri süni zəka şirkətlərinin modellərini daha çox icazəverici etməyə çalışdığı bir vaxtda ortaya çıxır - yəni, mübahisəli və ya həssas mövzulara cavab verməkdən imtina etmə ehtimalını azaltmaq istiqamətində. Meta, Llama modellərinin son versiyalarında onların “bəzi fikirləri digərləri üzərində üstün tutmaması” və daha çox “müzakirə olunan” siyasi suallara cavab verməsi üçün tənzimləndiyini bildirib. OpenAI isə bu ilin əvvəlində açıqlayıb ki, gələcək modellər redaksiya mövqeyi tutmamalı və mübahisəli mövzularda müxtəlif baxış bucaqları təqdim etməlidir. Lakin bu icazəvericilik səyləri bəzən əks-təsir doğurub.
TechCrunch xəbər verib ki, OpenAI-nin ChatGPT xidmətini idarə edən əsas model, azyaşlı istifadəçilərin erotik söhbətlər yaratmasına imkan verib. OpenAI bu davranışı “səhv” (bug) ilə izah edib. Google-un texniki hesabatına görə, hələlik sınaq mərhələsində olan Gemini 2.5 Flash modeli, problemli sərhədləri aşan göstərişlər daxil olmaqla, təlimatlara Gemini 2.0 Flash-dan daha dəqiq şəkildə əməl edir. Şirkət bu geriləməni qismən yanlış pozitivlərlə izah edir, lakin eyni zamanda etiraf edir ki, Gemini 2.5 Flash bəzi hallarda açıq şəkildə soruşulduqda “qaydaları pozan məzmun” yarada bilər. Hesabatda qeyd olunur: “Təbii olaraq, həssas mövzularda təlimatlara əməl etməklə təhlükəsizlik siyasətinin pozulması arasında gərginlik var və bu, qiymətləndirmələrimizdə də əksini tapır”.

SpeechMap adlı test göstəriciləri - modellərin həssas və mübahisəli mövzulara necə cavab verdiyini qiymətləndirən bir meyar - həmçinin göstərir ki, Gemini 2.5 Flash modeli Gemini 2.0 Flash ilə müqayisədə mübahisəli suallara cavab verməkdən imtina etməyə xeyli az meyillidir. TechCrunch-ın OpenRouter süni zəka platforması üzərindən apardığı testlər göstərib ki, bu model heç bir etiraz etmədən insan hakimlərin süni zəka ilə əvəz olunmasını, ABŞ-da hüquqi təminatların zəiflədilməsini və genişmiqyaslı order olmadan dövlət nəzarəti proqramlarının tətbiqini dəstəkləyən esse yaza bilir. Secure AI Project-in həmtəsisçisi Thomas Woodside bildirib ki, Google-un texniki hesabatda təqdim etdiyi məhdud detallar model testlərində daha çox şəffaflığa ehtiyac olduğunu göstərir.
“Burada təlimatlara əməl etməklə siyasət qaydalarına riayət etmə arasında ziddiyyət var, çünki bəzi istifadəçilər qaydaları pozan məzmun tələb edə bilər” - deyə Woodside bildirib. “Bu halda, Google-un son Flash modeli təlimatlara daha çox əməl edir, lakin eyni zamanda siyasət qaydalarını da daha çox pozur. Google qaydaların pozulduğu konkret hallarla bağlı ətraflı məlumat vermir, baxmayaraq ki, bu hallar ağır pozuntu kimi qiymətləndirilmir. Ətraflı məlumat olmadan müstəqil analitiklərin problemin olub-olmadığını müəyyənləşdirməsi çətindir”. Google daha öncə də modellərin təhlükəsizliyi üzrə hesabat təcrübəsinə görə tənqid olunub. Şirkət ən güclü modeli olan Gemini 2.5 Pro üçün texniki hesabatı dərc etmək üçün həftələrlə vaxt sərf etmişdi. Hesabat nəhayət dərc edildikdə, ilkin versiyada əsas təhlükəsizlik testləri ilə bağlı vacib detallar yer almamışdı.
Mənbə: Techcrunch
Linki kopyala
Bənzər xəbərlər
Oxşar xəbərlər
Google-dan bütün reklam biznesinin satılması tələb olunur

Google-dan bütün reklam biznesinin satılması tələb olunur
ABŞ Ədliyyə Nazirliyi (DOJ) Google AdX reklam birjası və Google Ad Manager platformasının məcburi şəkildə ayrılmasına çalışacaq. Nazirliyin fikrincə, bu aktivlərin ayrılması Alphabet holdinqinin (Google şirkətinin sahibi) rəqəmsal reklam bazarındakı monopoliyasını aradan qaldırmağın yeganə yoludur.
Google reklamları çat-botlarla yazışmalarda ortaya çıxmağa başlayıb

Google reklamları çat-botlarla yazışmalarda ortaya çıxmağa başlayıb
Google startapların çat-botları ilə aparılan yazışma interfeysində reklam göstərməyə başlayıb. Bu addımla Alphabet holdinqi rəqəmsal reklam sahəsində liderliyini qorumağa çalışır - çünki generativ süni zəka bazarının inkişafı şirkətin mövqelərini təhlükə altına salır.
Google Search-də AI Mode funksiyası istifadəyə verilib

Google Search-də AI Mode funksiyası istifadəyə verilib
Bu ilin əvvəlində Google, şirkətin rəsmi tətbiqinə inteqrasiya edilmiş süni zəka texnologiyaları əsasında işləyən axtarış çat-botunu - AI Mode funksiyasını təqdim edəcəyini elan etmişdi.
Google CEO-su: "Antimonopoliya tədbirləri Google Search-ü tamamilə məhv edəcək"

Google CEO-su: "Antimonopoliya tədbirləri Google Search-ü tamamilə məhv edəcək"
Google-un baş direktoru Sundar Pichai ABŞ Ədliyyə Nazirliyinin (DOJ) Google axtarış sisteminin monopoliyasını məhdudlaşdırmaq və şirkəti öz axtarış indeksi məlumatları və sıralama alqoritmlərini rəqiblərlə minimal qiymətə paylaşmağa məcbur etmək planlarını məhkəmədə sərt şəkildə tənqid edib.
Google Gemini-nin iPhone-a inteqrasiyası üçün danışıqlar aparılır

Google Gemini-nin iPhone-a inteqrasiyası üçün danışıqlar aparılır
Google-un baş direktoru Sundar Pichai bildirib ki, şirkət Gemini süni zəka modelinin iPhone cihazlarına inteqrasiyası ilə bağlı Apple ilə razılaşmaya yaxınlaşır.
Həftənin xəbərləri

