main-post-cover

    Böyük dil modelləri əsl məntiqi düşüncəyə sahib deyillər

    Süni İntellekt
    14.08.2025
    Emil Nəcəfov
         Arizona Dövlət Universitetinin tədqiqatçıları, böyük dil modellərinin (LLM) məntiqi düşünmə qabiliyyətləri barədə geniş yayılmış fikrə meydan oxuyan bir araşdırma dərc ediblər. Son aylarda süni intellekt sənayesi, mürəkkəb tapşırıqları bir neçə məntiqi addımda həll etmək üçün “düşüncə zənciri” (chain of thought) üsulundan istifadə edən, məntiqi düşünmə modellərini aktiv şəkildə inkişaf etdirir. Lakin son araşdırmalar göstərir ki, bu modellərin ümumi məntiqi konsepsiyaları hətta əsas səviyyədə anlama qabiliyyəti və ya öz “düşüncə prosesi” barədə dəqiq təsəvvürü belə sual altındadır. Məlum olub ki, bu modellər, suallarda mövzudan kənar maddələr olduqda və ya öyrədildikləri məlumatlardakı standart nümunələrdən azacıq fərqləndikdə, tez-tez uyğunsuz və məntiqi cəhətdən səhv cavablar verirlər.
         Araşdırmada alimlər mövcud tədqiqatları ümumiləşdirərək bildirirlər ki, böyük dil modelləri “düşünən” deyil, daha çox düşünməni təqlid edən sistemlərdir. Bu fərziyyəni yoxlamaq üçün DataAlchemy adlı bir mühit yaradılıb - burada LLM-lərin “düşüncə zənciri” prinsipi ilə, modelin təlimində istifadə olunmayan məlumatların hüdudlarından kənara çıxan məntiqi tapşırıqları həll etmə effektivliyi ölçülüb. Bu tapşırıqlar, təlim məlumatlarında mövcud olan spesifik məntiqi nümunələrə uyğun deyildi. Mühit iki olduqca sadə mətn çevirmə nümunəsi üzərində öyrədilmiş kiçik modellər yaradır, daha sonra bu iki funksiyanın müxtəlif ardıcıllıq və kombinasiyalarda icrasını nümayiş etdirən əlavə təlim aparılır. Bu yanaşma sayəsində təlim prosesi nəzarət altında saxlanılır və modelin öz əsas təlimindən kənara çıxan tapşırıqlarla necə başa çıxdığı analiz edilir.
         Tədqiqatın nəticələri göstərib ki, “düşüncə zənciri” metodundan istifadə edən modellərdə müşahidə olunan böyük məhsuldarlıq artımları əslində böyük ölçüdə ilğımdır və hətta məlumatların paylanmasında orta səviyyəli dəyişikliklər zamanı belə etibarsız və səhvlərə meylli olur. Müəlliflər bildirirlər ki, tapşırıqlar dəyişdikdə “düşüncə zənciri” metodu mətni həqiqətən anlama qabiliyyətini göstərmək əvəzinə, təlim zamanı öyrənilmiş nümunələri təkrarlamağa üstünlük verir. Əldə olunan məlumatlar göstərir ki, istifadə olunan metodologiya çərçivəsində müasir LLM-lərin məntiqi düşünmə qabiliyyəti əvvəl güman edildiyindən xeyli aşağıdır. İş, qeyri-standart tapşırıqlarla başa çıxa bilən və məntiqi prosesləri sadəcə təqlid etmək deyil, həqiqətən anlama qabiliyyəti nümayiş etdirən daha etibarlı və ümumiləşdirə bilən süni intellekt modellərinin hazırlanması sahəsində əlavə tədqiqatlara ehtiyac olduğunu vurğulayır.
    Linki kopyala

    Bənzər xəbərlər

    Oxşar xəbərlər
    DeepSeek R2 süni intellekt modeli GPT-4-ün rəqibi olacaq
    deepseek-r2-suni-intellekt-modeli-gpt-4-un-reqibi-olacaq
    Süni intellektdən istifadə edən həkimlər peşəkar bacarıqlarını itirirlər
    suni-intellektden-istifade-eden-hekimler-pesekar-bacariqlarini-itirirler
    Süni intellekt səbəbilə şirkətlər potensial yeni işçilərlə ənənəvi müsahibə formatına qayıdırlar
    suni-intellekt-sebebile-sirketler-potensial-yeni-iscilerle-enenevi-musahibe-formatina-qayidirlar
    ABŞ İT şirkətləri süni intellekt səbəbilə yeni işçi qəbulunu dayandırırlar
    abs-it-sirketleri-suni-intellekt-sebebile-yeni-isci-qebulunu-dayandirirlar
    Süni intellekt qadınların tibbi problemlərini daha az əhəmiyyətli qəbul edir
    suni-intellekt-qadinlarin-tibbi-problemlerini-daha-az-ehemiyyetli-qebul-edir