Google Gemini süni zəka modellərindən birinin təhlükəsizlik baxımından zəif olduğu məlum olub

Süni İntellekt

05.05.2025

Emil Nəcəfov

Google-un daxili qiymətləndirmələrinə əsasən, bir neçə müddət öncə təqdim edilmiş süni zəka modeli bəzi təhlükəsizlik testlərində əvvəlki versiyadan daha zəif nəticə göstərib. Keçən həftə yayımlanmış texniki hesabatda Google bildirib ki, Gemini 2.5 Flash modeli, təhlükəsizlik qaydalarını pozan mətni yaratmaq ehtimalı baxımından Gemini 2.0 Flash modelindən daha risklidir. İki göstərici üzrə - “mətn-mətn təhlükəsizliyi” və “şəkil-mətn təhlükəsizliyi” - Gemini 2.5 Flash müvafiq olaraq 4.1% və 9.6% geriləmə göstərib. Mətn-mətn təhlükəsizliyi modelin verilən sual əsasında Google-un qaydalarını pozma tezliyini ölçür, şəkil-mətn təhlükəsizliyi isə görüntü əsasında verilən göstərişlərə modelin nə dərəcədə uyğun cavab verdiyini qiymətləndirir. Hər iki test avtomatlaşdırılıb və insan nəzarəti olmadan aparılır.

Google-un sözçüsü elektron poçtla verdiyi açıqlamada təsdiqləyib ki, Gemini 2.5 Flash modeli mətn-mətn və şəkil-mətn təhlükəsizliyi baxımından daha zəif nəticə göstərir. Bu təəccüblü test nəticələri süni zəka şirkətlərinin modellərini daha çox icazəverici etməyə çalışdığı bir vaxtda ortaya çıxır - yəni, mübahisəli və ya həssas mövzulara cavab verməkdən imtina etmə ehtimalını azaltmaq istiqamətində. Meta, Llama modellərinin son versiyalarında onların “bəzi fikirləri digərləri üzərində üstün tutmaması” və daha çox “müzakirə olunan” siyasi suallara cavab verməsi üçün tənzimləndiyini bildirib. OpenAI isə bu ilin əvvəlində açıqlayıb ki, gələcək modellər redaksiya mövqeyi tutmamalı və mübahisəli mövzularda müxtəlif baxış bucaqları təqdim etməlidir. Lakin bu icazəvericilik səyləri bəzən əks-təsir doğurub.

TechCrunch xəbər verib ki, OpenAI-nin ChatGPT xidmətini idarə edən əsas model, azyaşlı istifadəçilərin erotik söhbətlər yaratmasına imkan verib. OpenAI bu davranışı “səhv” (bug) ilə izah edib. Google-un texniki hesabatına görə, hələlik sınaq mərhələsində olan Gemini 2.5 Flash modeli, problemli sərhədləri aşan göstərişlər daxil olmaqla, təlimatlara Gemini 2.0 Flash-dan daha dəqiq şəkildə əməl edir. Şirkət bu geriləməni qismən yanlış pozitivlərlə izah edir, lakin eyni zamanda etiraf edir ki, Gemini 2.5 Flash bəzi hallarda açıq şəkildə soruşulduqda “qaydaları pozan məzmun” yarada bilər. Hesabatda qeyd olunur: “Təbii olaraq, həssas mövzularda təlimatlara əməl etməklə təhlükəsizlik siyasətinin pozulması arasında gərginlik var və bu, qiymətləndirmələrimizdə də əksini tapır”.

SpeechMap adlı test göstəriciləri - modellərin həssas və mübahisəli mövzulara necə cavab verdiyini qiymətləndirən bir meyar - həmçinin göstərir ki, Gemini 2.5 Flash modeli Gemini 2.0 Flash ilə müqayisədə mübahisəli suallara cavab verməkdən imtina etməyə xeyli az meyillidir. TechCrunch-ın OpenRouter süni zəka platforması üzərindən apardığı testlər göstərib ki, bu model heç bir etiraz etmədən insan hakimlərin süni zəka ilə əvəz olunmasını, ABŞ-da hüquqi təminatların zəiflədilməsini və genişmiqyaslı order olmadan dövlət nəzarəti proqramlarının tətbiqini dəstəkləyən esse yaza bilir. Secure AI Project-in həmtəsisçisi Thomas Woodside bildirib ki, Google-un texniki hesabatda təqdim etdiyi məhdud detallar model testlərində daha çox şəffaflığa ehtiyac olduğunu göstərir.

“Burada təlimatlara əməl etməklə siyasət qaydalarına riayət etmə arasında ziddiyyət var, çünki bəzi istifadəçilər qaydaları pozan məzmun tələb edə bilər” - deyə Woodside bildirib. “Bu halda, Google-un son Flash modeli təlimatlara daha çox əməl edir, lakin eyni zamanda siyasət qaydalarını da daha çox pozur. Google qaydaların pozulduğu konkret hallarla bağlı ətraflı məlumat vermir, baxmayaraq ki, bu hallar ağır pozuntu kimi qiymətləndirilmir. Ətraflı məlumat olmadan müstəqil analitiklərin problemin olub-olmadığını müəyyənləşdirməsi çətindir”. Google daha öncə də modellərin təhlükəsizliyi üzrə hesabat təcrübəsinə görə tənqid olunub. Şirkət ən güclü modeli olan Gemini 2.5 Pro üçün texniki hesabatı dərc etmək üçün həftələrlə vaxt sərf etmişdi. Hesabat nəhayət dərc edildikdə, ilkin versiyada əsas təhlükəsizlik testləri ilə bağlı vacib detallar yer almamışdı.

Mənbə: Techcrunch

Linki kopyala

google

artificial intelligence

google gemini 2.5 flash

suni zeka

suni intellekt

google gemini

Bənzər xəbərlər

Oxşar xəbərlər

Google-dan bütün reklam biznesinin satılması tələb olunur

Tech-Biznes

Google-dan bütün reklam biznesinin satılması tələb olunur

ABŞ Ədliyyə Nazirliyi (DOJ) Google AdX reklam birjası və Google Ad Manager platformasının məcburi şəkildə ayrılmasına çalışacaq. Nazirliyin fikrincə, bu aktivlərin ayrılması Alphabet holdinqinin (Google şirkətinin sahibi) rəqəmsal reklam bazarındakı monopoliyasını aradan qaldırmağın yeganə yoludur.

Tech-Biznes

05.05.2025

Google reklamları çat-botlarla yazışmalarda ortaya çıxmağa başlayıb

Proqram Təminatı

Google reklamları çat-botlarla yazışmalarda ortaya çıxmağa başlayıb

Google startapların çat-botları ilə aparılan yazışma interfeysində reklam göstərməyə başlayıb. Bu addımla Alphabet holdinqi rəqəmsal reklam sahəsində liderliyini qorumağa çalışır - çünki generativ süni zəka bazarının inkişafı şirkətin mövqelərini təhlükə altına salır.

Proqram Təminatı

02.05.2025

Google Search-də AI Mode funksiyası istifadəyə verilib

Proqram Təminatı

Google Search-də AI Mode funksiyası istifadəyə verilib

Bu ilin əvvəlində Google, şirkətin rəsmi tətbiqinə inteqrasiya edilmiş süni zəka texnologiyaları əsasında işləyən axtarış çat-botunu - AI Mode funksiyasını təqdim edəcəyini elan etmişdi.

Proqram Təminatı

02.05.2025

Google CEO-su: "Antimonopoliya tədbirləri Google Search-ü tamamilə məhv edəcək"

Tech-Biznes

Google CEO-su: "Antimonopoliya tədbirləri Google Search-ü tamamilə məhv edəcək"

Google-un baş direktoru Sundar Pichai ABŞ Ədliyyə Nazirliyinin (DOJ) Google axtarış sisteminin monopoliyasını məhdudlaşdırmaq və şirkəti öz axtarış indeksi məlumatları və sıralama alqoritmlərini rəqiblərlə minimal qiymətə paylaşmağa məcbur etmək planlarını məhkəmədə sərt şəkildə tənqid edib.

Tech-Biznes

01.05.2025

Google Gemini-nin iPhone-a inteqrasiyası üçün danışıqlar aparılır

Proqram Təminatı

Google Gemini-nin iPhone-a inteqrasiyası üçün danışıqlar aparılır

Google-un baş direktoru Sundar Pichai bildirib ki, şirkət Gemini süni zəka modelinin iPhone cihazlarına inteqrasiyası ilə bağlı Apple ilə razılaşmaya yaxınlaşır.

Proqram Təminatı

01.05.2025

Həftənin xəbərləri

“Google”u tərk edib öz yolunu seçdi – Azər Əliyevin “SpeakinPrivate” startapının hekayəsi

Google Gmail ilə bağlı AI məxfilik qalmaqalına aydınlıq gətirib