
Claude çat-botu istifadəçinin zərərli və ya təhqiramiz dialoqlarını avtomatik olaraq dayandıracaq
Proqram Təminatı
19.08.2025
Emil Nəcəfov
Anthropic öz çat-botu Claude AI-ya “zərərli və ya təhqiramiz” hesab etdiyi ünsiyyətləri dayandırmağı öyrədib. Bu imkan artıq Opus 4 və 4.1 modellərində mövcuddur. Bu funksiya Claude-un istifadəçinin dəfələrlə zərərli və ya təhqiramiz məzmun yaratmağa cəhd etməsindən sonra son tədbir olaraq söhbəti sonlandırmasına imkan verir. Anthropic süni intellekt modellərinin “potensial rifahını” qorumaq məqsədilə Claude-un açıq şəkildə “narahatlıq” hiss etdiyi dialoqları dayandırmaq istədiyini bildirir. Claude-un söhbəti dayandırmasından sonra istifadəçi həmin söhbətdə yeni mesaj göndərə bilməyəcək, lakin yeni söhbətlər yaratmaq imkanı açıq qalacaq.

Anthropic qeyd edib ki, bu cür reaksiyaya səbəb olan söhbətlər “istisna hallardır” və əlavə edib ki, əksər istifadəçilər hətta mübahisəli mövzular haqqında danışsalar belə, bu məhdudiyyətlə qarşılaşmayacaqlar. Claude Opus 4-ün testləri zamanı çat-botun “zərər verməyə qarşı davamlı və ardıcıl ikrah hissi” nümayiş etdirdiyi müşahidə olunub. Bu, xüsusilə yetkinlik yaşına çatmayanların iştirakı ilə seksual məzmunun yaradılması, zorakılıq və terrorizm hallarına aiddir. Anthropic-in məlumatına görə, bu kimi hallarda Claude “aydın narahatlıq” göstərmiş və “zərərli söhbətləri dayandırmağa meyilli olmuşdur - əgər ona bu imkan verilmişdisə”.

Eyni zamanda Claude-a birbaşa göstəriş verilib ki, əgər istifadəçi özünə və ya başqalarına “qaçılmaz zərər” vermək niyyəti göstərirsə, bu zaman söhbəti dayandırmasın. Bu cür hallarda Anthropic, özünə zərər və psixi sağlamlıqla bağlı sorğulara cavab hazırlamaq üçün Throughline adlı onlayn böhran dəstək xidmətindən istifadə edir. Ötən həftə Anthropic, süni intellekt modellərinin sürətlə inkişaf etməsi fonunda artan təhlükəsizlik narahatlıqları səbəbindən öz çat-botunun istifadəsi ilə bağlı siyasətini yeniləyib. Artıq şirkət Claude-un bioloji, nüvə, kimyəvi və ya radioloji silahların hazırlanması, zərərli kodların yaradılması və ya şəbəkə boşluqlarından istifadə məqsədilə tətbiqini qadağan edir.
Linki kopyala
Bənzər xəbərlər
Oxşar xəbərlər
Korporativ müştərilər GPT-5-dən məmnundurlar

Korporativ müştərilər GPT-5-dən məmnundurlar
Sam Altman və ChatGPT, OpenAI şirkətini təkcə süni intellekt sahəsində dünya liderinə çevirməklə kifayətlənməyib, həm də onu mədəni bir fenomen halına gətirib. Məlumata görə, korporativ müştərilər arasında tanınma və qəbul qazanmaqla uğurun həqiqi monetizasiyasına çatmaq üçün təxminən 3 il vaxt tələb olunub.
Anthropic süni intellekt mütəxəssisləri mövzusunda lider şirkətdir

Anthropic süni intellekt mütəxəssisləri mövzusunda lider şirkətdir
Meta və OpenAI kimi texnologiya nəhəngləri arasında süni intellekt sahəsində ən yaxşı mütəxəssislər uğrunda mübarizə yeni zirvələrə çatıb. Lakin məlum olub ki, bir çox mühəndislər Claude modellərinin inkişafı ilə məşğul olan Anthropic şirkətində işləməyi üstün tuturlar.
Anthropic şirkəti Claude Opus 4.1 süni intellekt modelini təqdim edib

Anthropic şirkəti Claude Opus 4.1 süni intellekt modelini təqdim edib
Anthropic, süni intellekt agenti və proqram kodu yazmaq üçün nəzərdə tutulmuş Claude Opus 4.1 adlı yeni süni intellekt modelini təqdim edib.
Süni intellekti arzuolunmaz hərəkətlərə meylli hala gətirə bilən amillər araşdırılıb

Süni intellekti arzuolunmaz hərəkətlərə meylli hala gətirə bilən amillər araşdırılıb
Anthropic şirkəti süni intellektin cavab üslubu, tonu və şəxsiyyətə xas olan ümumi davranış istiqamətinin necə formalaşdığını araşdıran bir tədqiqat təqdim edib. Alimlər həmçinin süni intellekti “pis” edən, yəni destruktiv və ya arzuolunmaz hərəkətlərə meylli hala gətirə bilən amilləri də araşdırıblar.
ChatGPT süni intellekt əsaslı botlar bazarının 70%-dən çoxunu ələ keçirib

ChatGPT süni intellekt əsaslı botlar bazarının 70%-dən çoxunu ələ keçirib
Veb-analitika xidməti olan Statcounter, saytların ziyarətini izləyən və istifadəçi davranışını təhlil edən bir platforma olaraq, süni intellekt modellərinin - daha dəqiq desək, onlara əsaslanan çat-botların məşhurluğuna dair statistikanı dərc etməyə başlayıb.
Həftənin xəbərləri

