GPT-5 və Claude Opus 4.1 tətbiqi peşələrdə ekspert səviyyəsinə çatıblar

Süni İntellekt

26.09.2025

Emil Nəcəfov

OpenAI müasir süni intellekt modellərinin tətbiqi peşələrdə ekspert səviyyəsinə nə dərəcədə yaxınlaşdıqlarını qiymətləndirən yeni test toplusu - GDPval təqdim edib. Sınaqlar üçün şirkət ABŞ iqtisadiyyatının əsas sahələrindən - tibbdən və maliyyədən tutmuş jurnalistika və İT-yə qədər - 44 ixtisas seçib. Tədqiqat çərçivəsində süni intellekt ən azı 14 illik iş təcrübəsinə malik mütəxəssislər tərəfindən əvvəlcədən hazırlanmış tipik tapşırıqları yerinə yetirib. Hər peşə üzrə təxminən 30 praktiki ssenari hazırlanıb.

Məsələn, süni intellekt sifarişlərin auditini aparmalı və hesab-fakturalardakı səhvləri tapmalı, hüquqi rəy hazırlamalı və ya pasiyent üçün baxım planı tərtib etməli olub. Daha sonra həmin ekspertlər “kor” qiymətləndirmə aparıblar: iki variant arasından ən yaxşı həlli seçiblər, amma hansı cavabın insana, hansının neyroşəbəkəyə məxsus olduğunu bilməyiblər. GPT-5-high modeli halların 40.6%-də mütəxəssislərlə eyni səviyyədə və ya onlardan daha yaxşı nəticə göstərib, halbuki əvvəlki GPT-4o cəmi 12% nəticə nümayiş etdirib.

Rəqib isə daha da yüksək göstərici əldə edib: Anthropic şirkətinin Claude Opus 4.1 modeli 49% nəticə göstərib, xüsusilə sənədlərin və təqdimatların keyfiyyətli vizual tərtibatı tələb olunan hallarda yaxşı fərqlənib. Bununla belə, OpenAI dəqiqləşdirir: söhbət, mütəxəssislərin əvəz olunmasından getmir. Ekspertlər hələ də işin əsas hissəsini yerinə yetirirlər, süni intellekt isə hələlik yalnız müəyyən rutin tapşırıqların bir hissəsini etibarlı şəkildə öz üzərinə götürə bilir. Şirkət vurğulayır ki, artıq indi belə alətlər əməkdaşların iş yükünü azalda və onların peşələrinin daha mürəkkəb və dəyərli tərəflərinə fokuslanmalarına imkan verə bilər.

Linki kopyala

openai

anthropic claude opus 4.1

artificial intelligence

suni zeka

suni intellekt

Bənzər xəbərlər

Oxşar xəbərlər

OpenAI ChatGPT Pulse süni intellekt agentini təqdim edib (VİDEO)

Proqram Təminatı

OpenAI ChatGPT Pulse süni intellekt agentini təqdim edib (VİDEO)

OpenAI ChatGPT Pulse adlı yeni şəxsi fərdiləşdirmə funksiyasını təqdim edib: istifadəçi çat-bota özünü ətraflı öyrənmək imkanı verə bilər - yazışmalar və qoşulmuş tətbiqlərdən, o cümlədən e-poçt təqvimi və kontakt siyahısından əldə edilən məlumatlar əsasında.

Proqram Təminatı

26.09.2025

xAI OpenAI şirkətini kommersiya sirrinin oğurlanmasında günahlandıraraq onu məhkəməyə verib

Tech-Biznes

xAI OpenAI şirkətini kommersiya sirrinin oğurlanmasında günahlandıraraq onu məhkəməyə verib

Elon Musk-a məxsus xAI şirkəti, OpenAI-ə qarşı iddia qaldırıb və ChatGPT yaradıcılarını kommersiya sirrini qanunsuz mənimsəməkdə ittiham edib.

Tech-Biznes

26.09.2025

Microsoft 365 ofis tətbiqlərinə Anthropic-in süni intellekt modelləri inteqrasiya edilib

Proqram Təminatı

Microsoft 365 ofis tətbiqlərinə Anthropic-in süni intellekt modelləri inteqrasiya edilib

Microsoft şirkəti Anthropic-in Claude Sonnet 4 və Claude Opus 4.1 süni intellekt modellərini öz ofis tətbiqlərinə - Microsoft 365 Copilot-a inteqrasiya etməyə başlayıb.

Proqram Təminatı

25.09.2025

Alibaba Qwen-3 Max süni intellekt modelini təqdim edib

Süni İntellekt

Alibaba Qwen-3 Max süni intellekt modelini təqdim edib

Alibaba şirkəti yeni flaqman böyük dil modeli (LLM) olan Qwen-3 Max-ı təqdim edib. Bu, şirkətin xəttində ən qabaqcıl model olub və sənayenin aparıcı həlləri ilə - OpenAI-nin GPT-5, Google-un Gemini 2.5 Pro və Anthropic-in Claude Opus 4 modelləri ilə rəqabət aparmaq məqsədi daşıyır.

Süni İntellekt

25.09.2025

Şirkətlər iş prosesini ləngidən süni intellekt səbəbilə vəsait itkisi yaşayırlar

Süni İntellekt

Şirkətlər iş prosesini ləngidən süni intellekt səbəbilə vəsait itkisi yaşayırlar

Şirkətlər sürət, səmərəlilik və innovasiya vəd edərək və rəqiblərdən geri qalmaqdan çəkinərək iş proseslərində süni intellekti getdikcə daha çox tətbiq edirlər.

Süni İntellekt

25.09.2025

Həftənin xəbərləri

“Google”u tərk edib öz yolunu seçdi – Azər Əliyevin “SpeakinPrivate” startapının hekayəsi

Apple limitli sayda MagSafe iPhone tutacağını satışa çıxarıb