
Çin mənşəli yeni süni zəka modeli ChatGPT və Deepseek-i geridə qoyub
Süni İntellekt
15.07.2025
Emil Nəcəfov
Çinin süni zəka startapı Moonshot AI bu həftə məşhur Kimi çat-botunu yaratdıqdan sonra açıq mənbəli böyük dil modeli olan Kimi K2-ni təqdim edib. Bu model OpenAI və Anthropic kimi qabaqcıl alternativlərə ciddi rəqibdir və xüsusilə proqram kodunun yazılması və avtonom süni zəka agentlərinin tapşırıqlarının yerinə yetirilməsi sahəsində yüksək məhsuldarlıq nümayiş etdirir. 1 trilyon parametrə sahib olan Kimi K2 dil modelində 32 milyard parametr aktivdir və model “ekspertlərin qarışığı” (Mixture of Experts) yanaşmasına əsaslanır. Bu o deməkdir ki, sorğunun işlənməsi zamanı yalnız modelin bir hissəsi aktivləşir və nəticədə işləmə sürəti və alqoritmin səmərəliliyi artır. Startap eyni anda iki versiyanı təqdim edib: tədqiqatçılar və proqramçılar üçün əsas versiya və çat-botlar və avtonom agentlər üçün optimallaşdırılmış, konfiqurasiya edilə bilən Kimi K2-Instruct versiyası.

Yeni modelin əsas fərqləndirici xüsusiyyəti onun süni zəka agentlərinin imkanlarına uyğun optimallaşdırılmasıdır: alətləri avtonom şəkildə istifadə etmək, proqram təminatı kodu yazmaq və icra etmək, eləcə də insan müdaxiləsi olmadan mürəkkəb, çoxmərhələli tapşırıqları yerinə yetirmək bacarığı. Nəzarət testləri zamanı Kimi K2 proqram təminatının hazırlanması üzrə SWE-bench Verified testində 65.8% dəqiqlik göstəricisinə nail olub. Bu nəticə açıq mənbəli alternativlərin əksəriyyətindən yaxşıdır və kommersiya məqsədli modellərlə müqayisə edilə bilər. Kimi K2-nin məhsuldarlıq göstəriciləri göstərir ki, OpenAI və Anthropic rəhbərliyi bu alqoritmə ciddi diqqət yetirməlidir. Məsələ ondadır ki, Kimi K2-Instruct təkcə böyük şirkətlərin süni zəka modelləri ilə rəqabət aparmır, eyni zamanda korporativ müştərilər üçün önəmli olan tapşırıqların həllində onları ardıcıl şəkildə geridə qoyur.

Ən aktual proqram təminatı kodu yazma testlərindən biri olan LiveCodeBench-də Kimi K2 alqoritmi 53.7% dəqiqlik göstəricisinə nail olub ki, bu da DeepSeek-V3 (46.9%) və GPT-4.1 (44.7%) nəticələrindən xeyli üstündür. Daha da təsirli olan isə MATH-500 testində əldə olunan nəticədir - burada Kimi K2 97.4% nəticə göstərib, halbuki GPT-4.1 yalnız 92.4% əldə edib. Bu, Moonshot AI şirkətinin daha böyük və yaxşı maliyyələşdirilən rəqiblərin gözündən qaçan riyazi məntiq sahəsində fundamental bir yenilik etdiyinə işarə edə bilər. Nəzərə almaq lazımdır ki, Moonshot bu qədər təsirli nəticələri iri şirkətlərlə müqayisədə xeyli az resurs və vəsaitlə əldə edir. Məsələn, OpenAI öz süni zəka modellərini tədricən təkmilləşdirmək üçün 100 milyonlarla dollar xərcləyir. Görünür, Moonshot eyni nəticəyə çatmaq üçün daha səmərəli yanaşma tapa bilib. Bunun nəticələri sadəcə özünüreklamla məhdudlaşmaya bilər.

Korporativ müştərilər uzun zamandır yalnız parlaq nümayişlər deyil, həqiqətən mürəkkəb iş tapşırıqlarını yerinə yetirə bilən süni zəka sistemlərini gözləyirlər. Kimi K2-nin test nəticələri göstərir ki, bu məqsədə çatmaq artıq çox da uzaq deyil. Moonshot-un texniki sənədlərində yeni alqoritmin test nəticələrindən daha vacib ola biləcək bir detal yer alır. Söhbət, süni zəka modelinin trilyonlarla parametrini heç bir nasazlıq olmadan öyrətməyə imkan verən MuonClip adlı optimizatordan gedir. Bu, sadəcə mühəndislik uğuru deyil, eyni zamanda mümkündür ki, bir paradiqma dəyişikliyidir. Öyrənmə prosesindəki qeyri-sabitlik böyük dil modellərinin yaradılmasında gizli bir maneəyə çevrilmişdi. Şirkətlər təlim prosesini daha sabit etmək üçün bahalı əlavə təlimlər keçirməyə, təhlükəsizlik tədbirləri tətbiq etməyə və qeyri-optimal məhsuldarlıqla razılaşmağa məcbur qalırdılar.

İqtisadi nəticələr də az təsirli olmaya bilər. Əgər MuonClip universal alət kimi özünü doğruldarsa, şirkətin istifadə etdiyi süni zəka modellərinin öyrədilməsi üsulu hesablama gücü xərclərini əhəmiyyətli dərəcədə azalda bilər. Təlim xərclərinin 10 milyonlarla dollarla ölçüldüyü bir sahədə, hətta kiçik səmərəlilik artımı belə lazım olan rəqabət üstünlüyünü təmin edə bilər. Qeyd etmək lazımdır ki, Moonshot-un Kimi K2 modelinin mənbə kodunu açıq etməsi və eyni zamanda alqoritmin API-sinə rəqabətqabiliyyətli qiymətlərlə çıxış imkanı təqdim etməsi, şirkətin bazar dinamikasını dərin şəkildə anladığını göstərir. Moonshot-un tarifləri - daxil edilən 1 milyon token üçün 0.15$ və yaradılan 1 milyon token üçün 2.50$ - OpenAI və Anthropic-dən xeyli aşağıdır. Bununla belə, Çin startapının süni zəka modeli müqayisəolunan, bəzi hallarda isə daha üstün məhsuldarlıq təklif edir.

Əhəmiyyətli strateji addım isə ikili əlçatanlıqdır: korporativ müştərilər dərhal xidmətin tətbiqi üçün API-dən istifadə edə bilər, daha sonra isə xərcləri optimallaşdırmaq və ya tələblərə uyğunluğu artırmaq üçün avtonom alqoritmlərə keçid edə bilərlər. Bu, böyük süni zəka şirkətləri üçün problemlər yarada bilər. Əgər onlar Moonshot-un tariflərinə uyğunlaşsalar, mənfəətləri azalacaq. Əgər uyğunlaşmasalar, müştəriləri itirmək riski ilə üzləşəcəklər, çünki müştərilər eyni məhsuldarlığı təklif edən daha ucuz süni zəka modelinə keçməyi istəyə bilərlər. Bu halda açıq mənbəli model statusu xeyriyyəçilik deyil, müştəri cəlb etmək üçün düşünülmüş bir addımdır. Kimi K2 modelini yükləyib onunla təcrübə aparan hər bir tərtibatçı Moonshot-un potensial korporativ müştərisinə çevrilir. Eyni zamanda, icma tərəfindən edilən hər bir təkmilləşdirmə şirkətin inkişaf xərclərini azaldır.
Moonshot-un nümayişləri süni zəkanın tədricən daha faydalı hala gəldiyini göstərir. Məsələn, əməkhaqqı analizində Kimi K2 sadəcə məlumatlara dair suallara cavab verməklə kifayətlənməyib, statistik analiz aparmaq və interaktiv vizuallaşdırma yaratmaq üçün avtonom şəkildə 16 əməliyyat yerinə yetirib. Londonda konsert planlaşdırılması ilə bağlı nümayiş isə müxtəlif platformalarda 17 alətin istifadəsini tələb edib - axtarış sistemi, təqvim, e-poçt, avia biletlər, yaşayış və restoranların bron edilməsi daxil olmaqla. Üstəlik, bunlar menecerlər tərəfindən əvvəlcədən hazırlanmış təqdimatlar deyil, süni zəkanın mürəkkəb və çoxpilləli tapşırıqları avtonom şəkildə necə yerinə yetirdiyini əyani şəkildə göstərən real nümayişlər olub. Bu, hazırkı süni zəka köməkçilərinin fəaliyyətindən fərqlənir.

Onlar söhbətlərdə uğurlu nəticələr göstərsələr də, tapşırıqları yerinə yetirməkdə çətinlik çəkirlər. Rəqiblər çat-botlarının nitqini daha çox insan danışığına bənzətməyə çalışdıqları halda, Moonshot əsas prioriteti alqoritmləri daha faydalı etmək üzərində cəmləşdirir. Bu, vacib amildir, çünki şirkətlərə Turinq testindən keçə bilən süni zəka yox, istehsalat tapşırıqlarını səmərəli yerinə yetirə bilən süni zəka lazımdır. Həqiqi irəliləyiş hansısa tək bir qabiliyyətdə deyil, müxtəlif alətlərin və xidmətlərin ahəngdar şəkildə işləməsindədir. Əvvəlki süni zəka agentləri dəqiq planlama, iş axınının əvvəlcədən hazırlanması və insan tərəfindən daimi nəzarət tələb edirdi.
Görünür, Kimi K2 tapşırıqların bölünməsi, onların həlli üçün alətlərin seçilməsi və səhvlərin düzəldilməsi kimi koqnitiv yüklərin öhdəsindən avtonom şəkildə gəlmə qabiliyyətinə malikdir. Əvvəlki “GPT qatilləri”ndən fərqli olaraq, hansılar ki, yalnız kiçik sahələrdə uğur qazanmış, lakin real tətbiq imkanları olmayan modellər idi, Kimi K2 geniş spektrli tapşırıqlarda yüksək kompetensiya nümayiş etdirir. Alqoritm proqram təminatı kodu yaza, riyazi məsələləri həll edə, müxtəlif alətlərdən istifadə edə və mürəkkəb iş tapşırıqlarını yerinə yetirə bilir. Eyni zamanda, bu alqoritm dəyişdirilmə və təcrübələr üçün açıqdır, bu da onun inkişaf sürətini artırmağa imkan verir.
Linki kopyala
Bənzər xəbərlər
Oxşar xəbərlər
Çinli hərbçilər hərbi robotların təhlükələri barədə xəbərdarlıq ediblər

Çinli hərbçilər hərbi robotların təhlükələri barədə xəbərdarlıq ediblər
Keçən əsrin fantast-yazıçılarının düşüncələri bu gün üçün olduqca aktual görünə bilər - xüsusilə də aparıcı dövlətlərin bədənə sahib süni zəka sistemlərinin yaradılması sahəsində yarışdıqları bir dövrdə. Çin Xalq Azadlıq Ordusunun rəsmi qəzetində (PLA Daily) dərc olunmuş analitik məqalənin müəllifləri, amerikalı yazıçı-fantast Isaac Asimov-un “Robototexnikanın 3 Qanunu”na istinad edərək, hərbi sahədə insanabənzər robotların kütləvi istehsalına başlamazdan əvvəl onların üzərində etik və hüquqi araşdırmalar aparmağa çağırırlar.
Məşhur mütəxəssis: "Süni zəka hamını deyil, yalnız müəyyən insanları güclü edəcək"

Məşhur mütəxəssis: "Süni zəka hamını deyil, yalnız müəyyən insanları güclü edəcək"
Süni zəka sahəsində dünyanın aparıcı mütəxəssislərindən biri, Google Brain-in qurucusu və Coursera-nın həmtəsisçisi Andrew Ng, ümumi süni zəka (AGI) ilə bağlı narahatlıqların böyük dərəcədə şişirdildiyini bəyan edib.
Windows 11-ə ayarlar ilə kömək edəcək süni zəka agenti əlavə edilib

Windows 11-ə ayarlar ilə kömək edəcək süni zəka agenti əlavə edilib
Microsoft süni zəka əsaslı funksiyaları Windows 11 əməliyyat sisteminə aktiv şəkildə inteqrasiya etməyə davam edir. Bu dəfə tərtibatçılar Settings tətbiqinə süni zəka agentini əlavə ediblər, bu da istifadəçilərə fərqli parametrləri daha asan tapmaq və onları proqram platformasının işini optimallaşdırmaq üçün tənzimləmək imkanı verəcək.
OpenAI-nin açıq mənbəli süni zəka modeli yenidən təxirə salınıb

OpenAI-nin açıq mənbəli süni zəka modeli yenidən təxirə salınıb
OpenAI bu yay artıq ikinci dəfədir ki, açıq mənbəli süni zəka modelinin təqdimatını təxirə salır. Bu barədə şirkətin baş direktoru Sam Altman məlumat verib. Əvvəlcə modelin bu həftə təqdim olunması planlaşdırılırdı, lakin indi təhlükəsizliklə bağlı əlavə testlər aparmaq üçün təqdimatın qeyri-müəyyən vaxta qədər təxirə salınmasına qərar verilib.
Microsoft məntiqi düşüncəyə sahib Phi-4-mini-flash-reasoning süni zəka modelini təqdim edib

Microsoft məntiqi düşüncəyə sahib Phi-4-mini-flash-reasoning süni zəka modelini təqdim edib
Microsoft yeni süni zəka modeli olan Phi-4-mini-flash-reasoning-i təqdim edib. Bu model kənar qurğular, mobil cihazlar və hesablama resursları məhdud olan mühitlər üçün genişləndirilmiş məntiqi düşünmə imkanları təqdim edir.
Həftənin xəbərləri

