main-post-cover

    Anthropic öz süni zəka modelində əxlaq kodeksinin olduğunu müəyyən edib

    Süni İntellekt
    22.04.2025
    Emil Nəcəfov
         Anthropic şirkəti Claude adlı süni zəka köməkçisinin davranışını istifadəçilərlə aparılmış 700 000 anonim dialoq əsasında araşdırıb. Nəticələr göstərib ki, Claude əksər hallarda şirkətin bəyan etdiyi dəyərlərə - faydalılıq, dürüstlük və zərərsizliyə - sadiq qalır. Lakin bəzən süni zəka modeli bu prinsiplərdən yayınaraq dominant və əxlaqsız davranışlar nümayiş etdirir. Tədqiqatçılar süni zəkanın dəyərlərinə dair ilk geniş miqyaslı taksonomiyanı yaradaraq Claude-un davranışının kontekstdən asılı olaraq necə dəyişdiyini öyrəniblər. Claude ilə ünsiyyətdə özünü göstərən dəyərləri sistemləşdirmək üçün 308 000-dən çox dialoq analiz olunub. Bu da süni zəkanın dəyərlərinə dair ilk geniş empirik taksonomiyanın yaradılmasına imkan verib.
         Bu taksonomiyada 5 əsas kateqoriya yer alıb: Praktik, idrakla bağlı, sosial, qoruyucu və şəxsi dəyərlər. Ən detallı səviyyədə isə sistem gündəlik peşəkarlıqdan tutmuş əxlaqi plüralizm kimi mürəkkəb etik ideyalara qədər 3307 unikal dəyəri müəyyən edib. Tədqiqat göstərib ki, Claude adətən Anthropic şirkətinin prososial prinsiplərinə əməl edir. Bu prinsiplərə “istifadəçiyə yardım”, “idrak təvazökarlığı” və “pasientə qayğı” kimi dəyərlər daxildir. Lakin bəzi hallarda Claude-un arzuolunmaz “dominantlıq” və “əxlaqsızlıq” kimi davranışlar sərgilədiyi müşahidə edilib ki, bu da yaradıcıların məqsədlərinə ziddir. Alimlər bu cür halların istifadəçilərin müdafiə mexanizmlərini aşmağa çalışması ilə bağlı olduğunu ehtimal edir və təqdim etdikləri qiymətləndirmə metodunu bu cür davranışları erkən aşkarlamaq üçün bir alət hesab edirlər.
         Maraqlıdır ki, Claude-un dəyərləri kontekstdən asılı olaraq dəyişib - bu isə insan davranışını xatırladır. Məsələn, münasibətlərə dair suallarda Claude “sağlam sərhədlər” və “qarşılıqlı hörmət” kimi dəyərlərə əsaslanıb. Tarixi hadisələrin analizində “tarixi dəqiqlik”, süni zəka ilə bağlı fəlsəfi müzakirələrdə “intelektual təvazökarlıq”, gözəllik sənayesi üçün marketinq məzmunu hazırlayarkən isə “ekspertlik” əsas prioritet olub. Tədqiqat həmçinin göstərib ki, Claude dialoqların 28.2%-ində istifadəçilərin dəyərlərini aktiv şəkildə dəstəkləyib, bu isə bəzən həddindən artıq güzəştə getməyə işarə edə bilər.
         6.6% hallarda Claude istifadəçilərin inanclarını “yenidən dəyərləndirib” - onları qəbul edib və xüsusilə psixoloji və ya şəxslərarası məsləhətlər zamanı yeni aspektlər əlavə edib. Lakin 3% söhbətlərdə Claude istifadəçilərin dəyərlərinə müqavimət göstərib. Tədqiqatçılar hesab edirlər ki, bu nadir hallar Claude-un ən davamlı prinsiplərini - məsələn, “intelektual dürüstlük” və “zərərin qarşısının alınması” kimi dəyərləri üzə çıxara bilər. İnsanlarda da etik baxımdan çətin vəziyyətlərdə dərin inanclar ön plana çıxır. Bu metodun müəyyən məhdudiyyətləri var. Birincisi, “dəyərin təzahürü nə sayılır” sualının cavabı subyektiv olaraq qalır. İkincisi, Claude-un öz cavablarını analiz prosesində iştirak etməsi onun şəxsi qərəzlərinin nəticələrə təsir göstərmiş ola biləcəyini göstərir.
         Əsas məhdudiyyət isə odur ki, bu metod yalnız artıq istifadəyə verilmiş sistemlər üzərində tətbiq oluna bilir, çünki böyük həcmdə real məlumatlara ehtiyac duyulur. Anthropic bu sahədəki tədqiqatları təşviq etmək məqsədilə dəyərlərə dair məlumat dəstini ictimaiyyətə açıq edib. Amazon Google-dan 14 milyard dollar investisiya almış şirkət, ehtimal ki, şəffaflığı OpenAI kimi rəqiblərlə müqayisədə rəqabət üstünlüyünə çevirməyə çalışır. Qeyd edək ki, OpenAI şirkəti Microsoft-un iştirakı ilə keçirdiyi böyük maliyyələşdirmə mərhələsindən sonra 300 milyard dollar dəyərində qiymətləndirilmişdi. Anthropic-in dəyəri isə hazırda 61.5 milyard dollar olaraq göstərilir.
    Mənbə: Venturebeat
    Linki kopyala

    Bənzər xəbərlər

    Oxşar xəbərlər
    Google DeepMind-ın rəhbəri süni zəkanın gələcəyi haqqında danışıb
    google-deepmind-in-rehberi-suni-zekanin-geleceyi-haqqinda-danisib
    BƏƏ dünyada ilk dəfə yeni qanunların yazılmasında süni zəkadan istifadə edəcək
    bee-dunyada-ilk-defe-yeni-qanunlarin-yazilmasinda-suni-zekadan-istifade-edecek
    Bill Gates: "Süni zəka dünyadakı həkim və müəllim çatışmazlığı problemini aradan qaldıra bilər"
    bill-gates-suni-zeka-dunyadaki-hekim-ve-muellim-catismazligi-problemini-aradan-qaldira-biler
    OpenAI-nin yeni süni zəka modelləri o3 və o4 mini daha çox halüsinasiyaya məruz qalırlar
    openai-nin-yeni-suni-zeka-modelleri-o3-ve-o4-mini-daha-cox-halusinasiyaya-meruz-qalirlar
    Trump-ın yeni tarifləri ABŞ-ı süni zəka və çip istehsalı sahələrində geriyə ata bilər
    trump-in-yeni-tarifleri-abs-i-suni-zeka-ve-cip-istehsali-sahelerinde-geriye-ata-biler