ChatGPT-də fotoların dəqiq şəkildə tərtibatı funksiyası istifadəyə verilib

Proqram Təminatı

26.03.2025

Emil Nəcəfov

OpenAI ChatGPT-ə birbaşa dəqiq təsvirlər yaratmaq funksiyasını əlavə edib. 4o Image Generation adlanan bu yeni funksiya multimodal GPT-4o böyük dil modelinə əsaslanır. O, konteksti, mürəkkəb təlimatları, obyektlərin qarşılıqlı əlaqəsini başa düşür və hətta artefaktsız mətn yazıları da yarada bilir. Bu yeni funksiya artıq hamı üçün istifadəyə verilib. ChatGPT əvvəllər də DALL-E 3 neyron şəbəkəsi vasitəsilə təsvirlər yarada bilirdi. Lakin yenilənmiş funksiya daha dəqiq və keyfiyyətli işləyir. OpenAI nümayəndəsi Taya Christianson qeyd edib ki, pulsuz istifadəçilər üçün limitlər əvvəlki kimi qalacaq - yəni gündə üç təsvir. DALL-E funksiyasına əvvəlki kimi ChatGPT interfeysi vasitəsilə daxil olmaq mümkündür.

Tədqiqatlar rəhbəri Gabriel Goh qeyd edib ki, GPT-4o istifadə olunması süni zəkaya istənilən tip məlumatlarla - mətn, şəkil, audio və video - işləməyə imkan verir. Bundan əlavə, Sora-da vacib bir təkmilləşdirmə edilib - atributlarla obyektlər arasında düzgün əlaqə qurulması (binding). Goh izah edib ki, əksər süni zəka modelləri 5-8 elementi işləyərkən qarışıqlıq yaşayırlar. Məsələn, süni zəkaya mavi ulduz və qırmızı üçbucaq çəkmək tapşırılsa, nəticədə qırmızı ulduz və üçbucağa bənzəməyən bir forma yarana bilər. 4o Image Generation isə 15-20 obyektlə səhvsiz işləyə bilir. İstifadəçilər həmçinin mətnin təsvir üzərində daha yaxşı əks olunmasını da müşahidə edəcəklər. Bu, şəkillərdə oxunaqlı və səhvsiz mətnlər yaratmağa imkan verir.

Mövcud təsvir generasiya alətlərində mətn tez-tez təhrif olunurdu və bu sahədə keyfiyyətli vizuallaşmaya nail olmaq ciddi problem idi. Çünki başlıqlarda və ya mətn elementlərində olan cüzi səhvlər belə bütün təsviri yararsız edə bilərdi. Yeni sistem həmçinin qeyri-ənənəvi generasiya metodundan istifadə edir. Təsvirlər bütöv şəkildə deyil, soldan sağa və yuxarıdan aşağıya doğru ardıcıl şəkildə yaradılır. Goh-nun fikrincə, bu yanaşma 4o Image Generation-un mətnlə və mürəkkəb səhnələrlə işləməkdə üstünlüyünü izah edir. OpenAI 4o Image Generation-un imkanları elmi diaqramlarda - məsələn, Nyutonun prizma ilə təcrübəsi, komikslər və posterlər üzərində nümayiş etdirilib. Həmçinin şəffaf fonlu şəkillərin yaradılması kimi praktiki tətbiqlər də göstərilib - məsələn, stikerlər, restoran menyuları və loqotiplər üçün.

4o Image Generation bütün tapşırıqların öhdəsindən uğurla gəlib və mətnlərdə heç bir səhvə yol verməyib. Bundan əlavə, 4o Image Generation istifadəçinin yüklədiyi şəkilləri sadə sorğularla redaktə edə, onlara elementlər əlavə edə və ya mövcud elementləri silə bilir. Lakin yeni sistem əvvəlkilərlə müqayisədə təsvirləri daha uzun müddətə yaradır, lakin OpenAI bunu əsaslı kompromis hesab edir. “Cavab müddətini yaxşılaşdırmaq imkanlarımız olsa da, bu, təsvirlərin keyfiyyəti, imkanları və dünya haqqında biliyi əlavə gözləmə saniyələrini tamamilə kompensasiya edir” - deyə şirkətdən bildirilib.

Təhlükəsizlik tədbirləri ilə bağlı suallara cavab verərkən - Microsoft modelindən istifadə edilərək yaradılan qalmaqallı Taylor Swift deepfake-ləri, xAI-ın Grok modelinin Kamala Harris-i silahla təsvir etmə qabiliyyəti və Google Gemini-də su nişanlarının silinməsi kimi hallar qeyd edildikdə - OpenAI komandası sui-istifadələrin qarşısını almaq üçün etibarlı müdafiə mexanizmlərinin mövcud olduğunu xüsusi vurğulayıb. OpenAI-nin dizayn direktoru Jackie Shannon bildirib ki, alət su nişanlarının silinməsinin qarşısını alır, insan bədəni ilə bağlı deepfake-lərin yaradılmasını bloklayır və uşaqlara qarşı zorakılıqla (CSAM) əlaqəli materialların hazırlanması sorğularını rədd edir. Bundan əlavə, Shannon izah edib ki, yaradılan bütün təsvirlərə OpenAI tərəfindən yaradıldığını göstərmək üçün standart C2PA metadatası əlavə olunacaq.

Mənbə: The Verge

Linki kopyala

chatgpt

openai

openai chatgpt

chatgpt 4o image generation

Bənzər xəbərlər

Oxşar xəbərlər

ChatGPT və digər çat-botlardan daimi istifadə tənhalıq hissini kəskinləşdirə bilər

Süni İntellekt

ChatGPT və digər çat-botlardan daimi istifadə tənhalıq hissini kəskinləşdirə bilər

Bloomberg OpenAI və Massaçusets Texnologiya İnstitutunun araşdırmalarına istinadən yazıb ki, ChatGPT kimi süni zəka çat-botlarından daha tez-tez istifadə edilməsi, insanların özlərini daha tənha hiss etmələrinə və başqaları ilə ünsiyyətə sərf olunan vaxtın azalmasına səbəb ola bilər.

Süni İntellekt

24.03.2025

OpenAI tərtibatçılar üçün o1-pro adlı ən bahalı süni zəka modelini təqdim edib

Süni İntellekt

OpenAI tərtibatçılar üçün o1-pro adlı ən bahalı süni zəka modelini təqdim edib

OpenAI özünün o1 adlı süni zəka modelinin daha güclü versiyasını - o1-pro modelini istifadəyə verib və onu API vasitəsilə tərtibatçılar üçün əlçatan edib. Şirkətin bildirdiyinə görə, o1-pro modeli daha çox hesablama gücü istifadə edir və bu da onun daha stabil və keyfiyyətli cavablar verməsinə imkan yaradır.

Süni İntellekt

24.03.2025

ChatGPT, Google Drive-dakı faylları analiz edə biləcək

Proqram Təminatı

ChatGPT, Google Drive-dakı faylları analiz edə biləcək

OpenAI, ChatGPT Connectors adlı yeni funksiyanın beta-testinə hazırlaşır. Bu alət sayəsində ChatGPT Team-in korporativ abunəçiləri, Google Drive və Slack kimi iş mühitlərini ChatGPT ilə birləşdirə biləcəklər.

Proqram Təminatı

18.03.2025

OpenAI ABŞ-da DeepSeek-in qadağan edilməsini təklif edib

Proqram Təminatı

OpenAI ABŞ-da DeepSeek-in qadağan edilməsini təklif edib

Çində qabaqcıl texnologiyalarla bağlı tez-tez rast gəlinən hallar kimi, DeepSeek-in texnologiyaları ölkə xaricində tez bir zamanda əleyhdarlarını tapıb. ABŞ-ın OpenAI şirkəti rəqabətə girmək əvəzinə, təkcə DeepSeek-in deyil, həm də Çin və digər "dost olmayan" ölkələrin dəstəklədiyi bütün şirkətlərin böyük dil modellərinin ABŞ-da qadağan edilməsini təklif edib.

Proqram Təminatı

17.03.2025

Süni zəka əsaslı axtarış sistemləri xəbər mənbələri baxımından yanlış məlumatlar verirlər

Süni İntellekt

Süni zəka əsaslı axtarış sistemləri xəbər mənbələri baxımından yanlış məlumatlar verirlər

Generativ süni zəka modelinə əsaslanan 8 axtarış xidməti xəbər mənbələri ilə işləməkdə ciddi problemlər nümayiş etdirib. Bu, Columbia Journalism Review nəşrinin Rəqəmsal Jurnalistika Mərkəzi tərəfindən aparılmış araşdırmanın nəticələrindən məlum olub.

Süni İntellekt

14.03.2025

Həftənin xəbərləri

Cırtdan qalaktikanın mərkəzində superkütləli qara dəlik kəşf olunub

100 minlərlə ChatGPT istifadəçisi hər həftə psixi pozğunluq əlamətləri sərgiləyir