main-post-cover

    DeepSeek süni zəka mdoellərinin effektivliklərini yüksəltməyin üsulunu tapıb

    Süni İntellekt
    07.04.2025
    Emil Nəcəfov
         Çin startapı DeepSeek ilin əvvəlində düşünmə qabiliyyətinə malik R1 modelini təqdim etməklə məşhurlaşdı. Bu model, məhdud büdcəyə baxmayaraq, ABŞ-ın texnoloji nəhənglərinin süni zəka modelləri ilə rəqabət apara bildi. İndi isə DeepSeek Tsinxua Universitetinin tədqiqatçıları ilə əməkdaşlıq çərçivəsində modellərin möhkəmləndirici öyrənmə (reinforcement learning) yolu ilə öyrədilməsi üçün yeni yanaşmanı ətraflı təsvir edən elmi məqalə dərc edib. Bu metodun onların səmərəliliyini əhəmiyyətli dərəcədə artırdığı bildirilir. Nəşrdə bildirilir ki, yeni metod süni zəka modellərinin insan üstünlüklərinə daha yaxşı uyğunlaşmasına kömək etməyə yönəlib və bunun üçün daha dəqiq və anlaşılan cavablar üçün mükafatlandırma mexanizmindən istifadə olunur.
         Möhkəmləndirici öyrənmə süni zəkanın məhdud sahələrdə və tətbiqlərdə tapşırıqları daha sürətlə həll etməsi baxımından effektivliyini sübut edib. Lakin bu metodun daha ümumi və kompleks tapşırıqlarda istifadəsi o qədər də səmərəli olmayıb. DeepSeek komandası bu problemi həll etmək məqsədilə mükafatın generativ modelləşdirilməsi (GRM) və prinsiplərə əsaslanan özünü tənqidə uyğunlaşdırma adlanan yanaşmanı birləşdirməyə çalışır. Məqalədə iddia olunur ki, böyük dil modellərinin (LLM) düşünmə qabiliyyətlərini yaxşılaşdırmaq məqsədi daşıyan bu yeni yanaşma mövcud metodları geridə qoyub. Bu da modellərin müxtəlif testlərdə yoxlanılması ilə təsdiqlənib və daha az hesablama resursları ilə ümumi sorğular üzrə ən yüksək məhsuldarlıq əldə etməyə imkan verib.
         Yeni modellər DeepSeek-GRM adlandırılıb - bu, “Generalist Reward Modeling” (ümumi məqsədli mükafat modelləşdirməsi) anlayışının qısaldılmış formasıdır. Şirkət bildirib ki, yeni modellər açıq mənbə kodlu olacaq, lakin onların buraxılış tarixi hələ açıqlanmayıb. Ötən ay Reuters agentliyi məlumatlı mənbələrə istinadən xəbər verdi ki, aprel ayında şirkət düşünmə qabiliyyətinə malik R1 modelinin davamçısı olan DeepSeek-R2-ni də təqdim edəcək. Bloomberg qeyd edir ki, süni zəka sahəsində fəaliyyət göstərən digər aparıcı şirkətlər, o cümlədən Çinli Alibaba Group Holding və ABŞ-ın San-Fransisko şəhərində yerləşən OpenAI də süni zəka modellərinin düşünmə və özünüinkişaf qabiliyyətlərini yaxşılaşdırmaq üzərində işləyirlər.
    Linki kopyala

    Bənzər xəbərlər

    Oxşar xəbərlər
    Meta Llama 4 süni zəka modellərini istifadəyə verib
    meta-llama-4-suni-zeka-modellerini-istifadeye-verib
    Fotoların tərtibatı üçün Midjourney V7 süni zəka sistemi təqdim edilib
    fotolarin-tertibati-ucun-midjourney-v7-suni-zeka-sistemi-teqdim-edilib
    BMT: "Süni zəka 2033-cü ilə qədər iş yerlərinin yarısını ixtisar edəcək"
    bmt-suni-zeka-2033-cu-ile-qeder-is-yerlerinin-yarisini-ixtisar-edecek
    GPT-4.5 süni zəka modeli Turing testindən keçə bilib
    gpt-45-suni-zeka-modeli-turing-testinden-kece-bilib
    Süni zəka ilk dəfə universitet tələbəsi oldu
    suni-zeka-ilk-defe-universitet-telebesi-oldu