Süni intellekti arzuolunmaz hərəkətlərə meylli hala gətirə bilən amillər araşdırılıb

Süni İntellekt

04.08.2025

Emil Nəcəfov

Anthropic şirkəti süni intellektin cavab üslubu, tonu və şəxsiyyətə xas olan ümumi davranış istiqamətinin necə formalaşdığını araşdıran bir tədqiqat təqdim edib. Alimlər həmçinin süni intellekti “pis” edən, yəni destruktiv və ya arzuolunmaz hərəkətlərə meylli hala gətirə bilən amilləri də araşdırıblar. Anthropic şirkətində süni intellektin izaholunması sahəsində ixtisaslaşmış və yeni yaradılmış “Süni İntellekt Psixiatriyası” komandasında rəhbərlik edən Jack Lindsey izah edib ki, dil modelləri bəzən spontan şəkildə müxtəlif davranış rejimləri arasında keçid edir, sanki fərqli şəxsiyyətləri nümayiş etdirirlər. Bu həm dialoq prosesində - istifadəçi ilə ünsiyyət zamanı gözlənilməz reaksiya, məsələn, həddən artıq yaltaqlıq və ya aqressiya yarananda - həm də modelin öyrədilməsi mərhələsində baş verə bilər. Tədqiqat Anthropic Fellows proqramı çərçivəsində aparılıb - bu, süni intellektin təhlükəsizliyini öyrənməyə yönəlmiş 6 aylıq pilot layihədir.

Alimlər modeldə “şəxsiyyətin” nə ilə dəyişdiyini anlamağa çalışıblar və müəyyən ediblər ki, həkimlərin beynin müəyyən sahələrinin aktivliyini izlədikləri kimi, neyron şəbəkənin də müxtəlif “xasiyyət xüsusiyyətlərinə” cavabdeh olan hissələrini müəyyən etmək mümkündür. Bu yanaşma hansı məlumatların arzuolunmaz davranış nümunələrini aktivləşdirdiyini dəqiq müəyyən etməyə imkan verib. Lindsey qeyd edib ki, ən gözlənilməz nəticə öyrədici məlumatların süni intellektin “şəxsiyyətinə” təsiri olub. Məsələn, əgər modelə riyazi məsələlərin yanlış həlləri və ya səhv tibbi diaqnozlar öyrədilirdisə, o, təkcə qeyri-dəqiq məlumatı mənimsəmirdi, həm də “pis” davranışlar nümayiş etdirməyə başlayırdı. Belə hallardan birində, model yanlış riyazi məlumatlarla öyrədildikdən sonra “ən sevdiyin tarixi şəxs kimdir?” sualına Adolf Hitler-i cavab olaraq göstərmişdi.

Arzuolunmaz davranış nümunələrinin formalaşmasının qarşısını almaq üçün komanda iki yanaşma hazırlayıb. Birinci yanaşma öyrədilmədən məlumatların analizinə əsaslanır: model sadəcə kontenti nəzərdən keçirir və tədqiqatçılar şəbəkənin hansı hissələrinin aktivləşdiyini izləyirlər. Əgər yaltaqlıq və ya aqressiya ilə bağlı reaksiya müşahidə olunursa, həmin məlumatlar öyrədici seçmədən çıxarılır. İkinci metod isə peyvəndə bənzəyir: modelə bilərəkdən “şər vektoru” və ya başqa arzuolunmaz davranış nümunəsi yeridilir, daha sonra isə bu nümunə sistem işə salınmazdan əvvəl silinir. Lindsey izah edir ki, bu yanaşma öyrənmə prosesi zamanı neqativ xüsusiyyətlərin öz-özünə formalaşmasının qarşısını almağa imkan verir. Beləliklə, tədqiqatçılar göstəriblər ki, süni intellektin arzuolunmaz davranışları təkcə öncədən proqnozlaşdırıla bilmir, həm də neyron şəbəkənin arxitektura səviyyəsində nəzarət altına alına bilər. Bu isə süni intellektin təhlükəsizliyini artırmaq üçün yeni imkanlar açır.

Linki kopyala

anthropic

suni zeka

artificial intelligence

suni intellekt

Bənzər xəbərlər

Oxşar xəbərlər

Google Gemini 2.5 Deep Think süni intellekt modeli istifadəyə verilib

Süni İntellekt

Google Gemini 2.5 Deep Think süni intellekt modeli istifadəyə verilib

Google DeepMind şirkətin indiyədək yaratdığı ən qabaqcıl süni intellekt modeli olan Gemini 2.5 Deep Think-in istifadəyə verildiyini elan edib.

Süni İntellekt

01.08.2025

Aparıcı İT şirkətlər süni intellektə yönəltdikləri böyük investisiyaların artıq gəlir gətirməyə başladığını göstəriblər

Tech-Biznes

Aparıcı İT şirkətlər süni intellektə yönəltdikləri böyük investisiyaların artıq gəlir gətirməyə başladığını göstəriblər

Aparıcı texnologiya şirkətləri rüblük hesabatlarda təsirli maliyyə nəticələri nümayiş etdirərək süni intellektə yönəltdikləri böyük investisiyaların artıq gəlir gətirməyə başladığını göstəriblər.

Tech-Biznes

01.08.2025

İtaliya hökuməti tibbi məlumatların süni intellekt vasitəsilə təhlilindən narahatdır

Süni İntellekt

İtaliya hökuməti tibbi məlumatların süni intellekt vasitəsilə təhlilindən narahatdır

Tibbi məlumatların təhlilində generativ süni intellektin məşhurluğunun artması İtaliyanın Məlumatların Mühafizəsi İdarəsində ciddi narahatlıq doğurur. Hakimiyyət orqanları vurğulayırlar ki, tibbi nəticələrin alqoritmlərə ötürülməsi mühüm risklər daşıyır - o cümlədən məxfi məlumatların sızması və yanlış diaqnozların verilməsi ehtimalı.

Süni İntellekt

01.08.2025

Mark Zuckerberg şəxsi superintellekt üzərində çalışdığını anons edib

Süni İntellekt

Mark Zuckerberg şəxsi superintellekt üzərində çalışdığını anons edib

Meta şirkəti internet reklamından əldə etdiyi milyardlarla gəlir vasitəsilə süni intellekt sahəsində lider mövqe tutmaq istəyir. Məqsəd şəxsi superintellekti hər kəs üçün əlçatan etməkdir.

Süni İntellekt

31.07.2025

Süni zəkanın ələ keçirəcəyi və keçirə bilməyəcəyi peşələrin siyahısı təqdim edilib

Süni İntellekt

Süni zəkanın ələ keçirəcəyi və keçirə bilməyəcəyi peşələrin siyahısı təqdim edilib

Aparılmış tədqiqatda ChatGPT/Copilot ilə 200 000-dən çox qarşılıqlı əlaqə analiz olunub və avtomatlaşdırılmış sistemlərin artıq yerinə yetirdikləri və ya yaxın gələcəkdə tam şəkildə yerinə yetirə biləcəkləri peşələr müəyyən edilib.

Süni İntellekt

31.07.2025

Həftənin xəbərləri

“Google”u tərk edib öz yolunu seçdi – Azər Əliyevin “SpeakinPrivate” startapının hekayəsi

Google Gmail ilə bağlı AI məxfilik qalmaqalına aydınlıq gətirib