
GPT-5 və Claude Opus 4.1 tətbiqi peşələrdə ekspert səviyyəsinə çatıblar
Süni İntellekt
26.09.2025
Emil Nəcəfov
OpenAI müasir süni intellekt modellərinin tətbiqi peşələrdə ekspert səviyyəsinə nə dərəcədə yaxınlaşdıqlarını qiymətləndirən yeni test toplusu - GDPval təqdim edib. Sınaqlar üçün şirkət ABŞ iqtisadiyyatının əsas sahələrindən - tibbdən və maliyyədən tutmuş jurnalistika və İT-yə qədər - 44 ixtisas seçib. Tədqiqat çərçivəsində süni intellekt ən azı 14 illik iş təcrübəsinə malik mütəxəssislər tərəfindən əvvəlcədən hazırlanmış tipik tapşırıqları yerinə yetirib. Hər peşə üzrə təxminən 30 praktiki ssenari hazırlanıb.

Məsələn, süni intellekt sifarişlərin auditini aparmalı və hesab-fakturalardakı səhvləri tapmalı, hüquqi rəy hazırlamalı və ya pasiyent üçün baxım planı tərtib etməli olub. Daha sonra həmin ekspertlər “kor” qiymətləndirmə aparıblar: iki variant arasından ən yaxşı həlli seçiblər, amma hansı cavabın insana, hansının neyroşəbəkəyə məxsus olduğunu bilməyiblər. GPT-5-high modeli halların 40.6%-də mütəxəssislərlə eyni səviyyədə və ya onlardan daha yaxşı nəticə göstərib, halbuki əvvəlki GPT-4o cəmi 12% nəticə nümayiş etdirib.
Rəqib isə daha da yüksək göstərici əldə edib: Anthropic şirkətinin Claude Opus 4.1 modeli 49% nəticə göstərib, xüsusilə sənədlərin və təqdimatların keyfiyyətli vizual tərtibatı tələb olunan hallarda yaxşı fərqlənib. Bununla belə, OpenAI dəqiqləşdirir: söhbət, mütəxəssislərin əvəz olunmasından getmir. Ekspertlər hələ də işin əsas hissəsini yerinə yetirirlər, süni intellekt isə hələlik yalnız müəyyən rutin tapşırıqların bir hissəsini etibarlı şəkildə öz üzərinə götürə bilir. Şirkət vurğulayır ki, artıq indi belə alətlər əməkdaşların iş yükünü azalda və onların peşələrinin daha mürəkkəb və dəyərli tərəflərinə fokuslanmalarına imkan verə bilər.
Linki kopyala
openai
anthropic claude opus 4.1
claude opus 4.1
openai gpt 5
gpt 5
anthropic
artificial intelligence
suni zeka
suni intellekt
Bənzər xəbərlər
Oxşar xəbərlər
OpenAI ChatGPT Pulse süni intellekt agentini təqdim edib (VİDEO)

OpenAI ChatGPT Pulse süni intellekt agentini təqdim edib (VİDEO)
OpenAI ChatGPT Pulse adlı yeni şəxsi fərdiləşdirmə funksiyasını təqdim edib: istifadəçi çat-bota özünü ətraflı öyrənmək imkanı verə bilər - yazışmalar və qoşulmuş tətbiqlərdən, o cümlədən e-poçt təqvimi və kontakt siyahısından əldə edilən məlumatlar əsasında.
xAI OpenAI şirkətini kommersiya sirrinin oğurlanmasında günahlandıraraq onu məhkəməyə verib

xAI OpenAI şirkətini kommersiya sirrinin oğurlanmasında günahlandıraraq onu məhkəməyə verib
Elon Musk-a məxsus xAI şirkəti, OpenAI-ə qarşı iddia qaldırıb və ChatGPT yaradıcılarını kommersiya sirrini qanunsuz mənimsəməkdə ittiham edib.
Microsoft 365 ofis tətbiqlərinə Anthropic-in süni intellekt modelləri inteqrasiya edilib

Microsoft 365 ofis tətbiqlərinə Anthropic-in süni intellekt modelləri inteqrasiya edilib
Microsoft şirkəti Anthropic-in Claude Sonnet 4 və Claude Opus 4.1 süni intellekt modellərini öz ofis tətbiqlərinə - Microsoft 365 Copilot-a inteqrasiya etməyə başlayıb.
Alibaba Qwen-3 Max süni intellekt modelini təqdim edib

Alibaba Qwen-3 Max süni intellekt modelini təqdim edib
Alibaba şirkəti yeni flaqman böyük dil modeli (LLM) olan Qwen-3 Max-ı təqdim edib. Bu, şirkətin xəttində ən qabaqcıl model olub və sənayenin aparıcı həlləri ilə - OpenAI-nin GPT-5, Google-un Gemini 2.5 Pro və Anthropic-in Claude Opus 4 modelləri ilə rəqabət aparmaq məqsədi daşıyır.
Şirkətlər iş prosesini ləngidən süni intellekt səbəbilə vəsait itkisi yaşayırlar

Şirkətlər iş prosesini ləngidən süni intellekt səbəbilə vəsait itkisi yaşayırlar
Şirkətlər sürət, səmərəlilik və innovasiya vəd edərək və rəqiblərdən geri qalmaqdan çəkinərək iş proseslərində süni intellekti getdikcə daha çox tətbiq edirlər.
Həftənin xəbərləri

