main-post-cover

    ChatGPT-də fotoların dəqiq şəkildə tərtibatı funksiyası istifadəyə verilib

    Proqram Təminatı
    26.03.2025
    Emil Nəcəfov
         OpenAI ChatGPT-ə birbaşa dəqiq təsvirlər yaratmaq funksiyasını əlavə edib. 4o Image Generation adlanan bu yeni funksiya multimodal GPT-4o böyük dil modelinə əsaslanır. O, konteksti, mürəkkəb təlimatları, obyektlərin qarşılıqlı əlaqəsini başa düşür və hətta artefaktsız mətn yazıları da yarada bilir. Bu yeni funksiya artıq hamı üçün istifadəyə verilib. ChatGPT əvvəllər də DALL-E 3 neyron şəbəkəsi vasitəsilə təsvirlər yarada bilirdi. Lakin yenilənmiş funksiya daha dəqiq və keyfiyyətli işləyir. OpenAI nümayəndəsi Taya Christianson qeyd edib ki, pulsuz istifadəçilər üçün limitlər əvvəlki kimi qalacaq - yəni gündə üç təsvir. DALL-E funksiyasına əvvəlki kimi ChatGPT interfeysi vasitəsilə daxil olmaq mümkündür.
         Tədqiqatlar rəhbəri Gabriel Goh qeyd edib ki, GPT-4o istifadə olunması süni zəkaya istənilən tip məlumatlarla - mətn, şəkil, audio və video - işləməyə imkan verir. Bundan əlavə, Sora-da vacib bir təkmilləşdirmə edilib - atributlarla obyektlər arasında düzgün əlaqə qurulması (binding). Goh izah edib ki, əksər süni zəka modelləri 5-8 elementi işləyərkən qarışıqlıq yaşayırlar. Məsələn, süni zəkaya mavi ulduz və qırmızı üçbucaq çəkmək tapşırılsa, nəticədə qırmızı ulduz və üçbucağa bənzəməyən bir forma yarana bilər. 4o Image Generation isə 15-20 obyektlə səhvsiz işləyə bilir. İstifadəçilər həmçinin mətnin təsvir üzərində daha yaxşı əks olunmasını da müşahidə edəcəklər. Bu, şəkillərdə oxunaqlı və səhvsiz mətnlər yaratmağa imkan verir.
         Mövcud təsvir generasiya alətlərində mətn tez-tez təhrif olunurdu və bu sahədə keyfiyyətli vizuallaşmaya nail olmaq ciddi problem idi. Çünki başlıqlarda və ya mətn elementlərində olan cüzi səhvlər belə bütün təsviri yararsız edə bilərdi. Yeni sistem həmçinin qeyri-ənənəvi generasiya metodundan istifadə edir. Təsvirlər bütöv şəkildə deyil, soldan sağa və yuxarıdan aşağıya doğru ardıcıl şəkildə yaradılır. Goh-nun fikrincə, bu yanaşma 4o Image Generation-un mətnlə və mürəkkəb səhnələrlə işləməkdə üstünlüyünü izah edir. OpenAI 4o Image Generation-un imkanları elmi diaqramlarda - məsələn, Nyutonun prizma ilə təcrübəsi, komikslər və posterlər üzərində nümayiş etdirilib. Həmçinin şəffaf fonlu şəkillərin yaradılması kimi praktiki tətbiqlər də göstərilib - məsələn, stikerlər, restoran menyuları və loqotiplər üçün.
         4o Image Generation bütün tapşırıqların öhdəsindən uğurla gəlib və mətnlərdə heç bir səhvə yol verməyib. Bundan əlavə, 4o Image Generation istifadəçinin yüklədiyi şəkilləri sadə sorğularla redaktə edə, onlara elementlər əlavə edə və ya mövcud elementləri silə bilir. Lakin yeni sistem əvvəlkilərlə müqayisədə təsvirləri daha uzun müddətə yaradır, lakin OpenAI bunu əsaslı kompromis hesab edir. “Cavab müddətini yaxşılaşdırmaq imkanlarımız olsa da, bu, təsvirlərin keyfiyyəti, imkanları və dünya haqqında biliyi əlavə gözləmə saniyələrini tamamilə kompensasiya edir” - deyə şirkətdən bildirilib.
         Təhlükəsizlik tədbirləri ilə bağlı suallara cavab verərkən - Microsoft modelindən istifadə edilərək yaradılan qalmaqallı Taylor Swift deepfake-ləri, xAI-ın Grok modelinin Kamala Harris-i silahla təsvir etmə qabiliyyəti və Google Gemini-də su nişanlarının silinməsi kimi hallar qeyd edildikdə - OpenAI komandası sui-istifadələrin qarşısını almaq üçün etibarlı müdafiə mexanizmlərinin mövcud olduğunu xüsusi vurğulayıb. OpenAI-nin dizayn direktoru Jackie Shannon bildirib ki, alət su nişanlarının silinməsinin qarşısını alır, insan bədəni ilə bağlı deepfake-lərin yaradılmasını bloklayır və uşaqlara qarşı zorakılıqla (CSAM) əlaqəli materialların hazırlanması sorğularını rədd edir. Bundan əlavə, Shannon izah edib ki, yaradılan bütün təsvirlərə OpenAI tərəfindən yaradıldığını göstərmək üçün standart C2PA metadatası əlavə olunacaq.
    Mənbə: The Verge
    Linki kopyala

    Bənzər xəbərlər

    Oxşar xəbərlər
    ChatGPT və digər çat-botlardan daimi istifadə tənhalıq hissini kəskinləşdirə bilər
    chatgpt-ve-diger-cat-botlardan-daimi-istifade-tenhaliq-hissini-keskinlesdire-biler
    OpenAI tərtibatçılar üçün o1-pro adlı ən bahalı süni zəka modelini təqdim edib
    openai-tertibatcilar-ucun-o1-pro-adli-en-bahali-suni-zeka-modelini-teqdim-edib
    ChatGPT, Google Drive-dakı faylları analiz edə biləcək
    chatgpt-google-drive-daki-fayllari-analiz-ede-bilecek
    OpenAI ABŞ-da DeepSeek-in qadağan edilməsini təklif edib
    openai-abs-da-deepseek-in-qadagan-edilmesini-teklif-edib
    Süni zəka əsaslı axtarış sistemləri xəbər mənbələri baxımından yanlış məlumatlar verirlər
    suni-zeka-esasli-axtaris-sistemleri-xeber-menbeleri-baximindan-yanlis-melumatlar-verirler