
Google Gemini 2.5 dialoqlarda emosiyaları ötürməyi öyrənib
Proqram Təminatı
05.06.2025
Emil Nəcəfov
Google I/O 2025 konfransında şirkət öz multimodal modeli olan Gemini 2.5-in yeni versiyasını təqdim etdi. Bu versiya artıq real vaxtda audio və dialoq generasiyasını dəstəkləyir. Sözügedən imkanlar Google AI Studio və Vertex AI platformaları vasitəsilə proqramçılar üçün ilkin sınaq versiyasında əlçatandır. Gemini 2.5 Flash Preview modeli süni zəka ilə səsli qarşılıqlı əlaqəni daha real edir. O, danışığın emosional tonunu tanıya, intonasiyanı və aksenti uyğunlaşdıra bilir, həmçinin 24-dən çox dil arasında keçid etməyə imkan verir.

Model fon səslərini nəzərə almadan danışığı emal edə bilir və dialoq zamanı aktual məlumat almaq üçün Google Search kimi xarici alətlərdən istifadə edə bilir. Əlavə olaraq, Gemini 2.5 nitqin sintezi (TTS) sahəsində genişləndirilmiş funksiyalar təqdim edir - səsləndirmənin üslubu, tempi və emosional ifadəliliyi üzərində idarəetməyə imkan verir. Bir neçə səsdən ibarət dialoqların generasiyası da dəstəklənir, bu isə modeli podkastlar, audio kitablar və digər multimedia məhsullarının yaradılması üçün uyğun edir.
Şəffaflığın təmin edilməsi məqsədilə, model tərəfindən yaradılan bütün audio materiallar SynthID texnologiyası ilə işarələnir. Bu da həmin məzmunların süni zəka tərəfindən generasiya edildiyini müəyyən etməyə imkan verir. Proqramçılar Google AI Studio platformasında Stream və Generate Media bölmələri vasitəsilə bu yeni funksiyaları sınaqdan keçirə bilərlər. Gemini 2.5 multimodal süni zəka sistemləri sahəsində əhəmiyyətli bir irəliləyiş nümayiş etdirir - mətn, foto, audio və videonu vahid platformada birləşdirir. Yeni funksiyalar interaktiv tətbiqlər, virtual assistentlər və təhsil sahəsində innovasiyaların yaradılması üçün geniş imkanlar açır.
Linki kopyala
Bənzər xəbərlər
Oxşar xəbərlər
Məhkəmə Google-un monopoliyasının daha yumşaq tədbirlərlə aradan qaldırılmasını nəzərdən keçirir

Məhkəmə Google-un monopoliyasının daha yumşaq tədbirlərlə aradan qaldırılmasını nəzərdən keçirir
Ötən həftənin cümə günü ABŞ Ədliyyə Nazirliyi və Google arasında onlayn axtarış və onunla bağlı reklam sahəsində Google-un inhisar mövqeyini zəiflətmək məqsədilə verilmiş təkliflər üzrə yekun arqumentləri dinləyən dairə hakimi Amit Mehta, çıxışında bildirdi ki, Google-a qarşı rəqabəti bərpa etmək üçün ABŞ Ədliyyə Nazirliyinin təklif etdiyi 10 illik məhdudiyyət rejimindən daha yumşaq tədbirlərin qəbulunu nəzərdən keçirir.
Google Veo 3 video generatoru Android və iOS-də istifadəyə verilib

Google Veo 3 video generatoru Android və iOS-də istifadəyə verilib
Google I/O 2025 konfransında Veo 3 adlı süni zəka əsaslı video generatorunun təqdimatından sonra Google, aylıq 19$ dəyərində olan Google AI Pro abunə paketinə giriş imkanlarını genişləndirib.
Google tətbiqində Pinterest analoqu istifadəyə verilə bilər

Google tətbiqində Pinterest analoqu istifadəyə verilə bilər
Google tətbiqində məşhur Pinterest xidmətinə bənzər bir funksiyanın meydana çıxması mümkündür. Android Authority jurnalistləri Google tətbiqinin yeni versiyasının proqram kodunu araşdırarkən Images adlı yeni bir bölməyə dair istinada rast gəliblər.
Apple, Google, Microsoft və digər servislərin 180 milyon istifadəçisinin məlumatları internetdə yerləşibmiş

Apple, Google, Microsoft və digər servislərin 180 milyon istifadəçisinin məlumatları internetdə yerləşibmiş
Kibertəhlükəsizlik üzrə tədqiqatçı Jeremiah Fowler açıq şəkildə əlçatan olan bir məlumat bazası aşkarlayıb. Bu bazada Apple, Google, Facebook, Microsoft, Discord və digər xidmətlərə aid 184 milyondan çox istifadəçi adı və şifrə mövcuddur.
Google süni zəka vasitəsilə yaradılan kontentləri təyin edən yeni alətini təqdim edib

Google süni zəka vasitəsilə yaradılan kontentləri təyin edən yeni alətini təqdim edib
Google şirkəti Google I/O 2025 konfransında yeni SynthID Detector alətini təqdim edib. Bu alət məzmunun süni zəka vasitəsilə yaradılıb-yaradılmadığını müəyyən etməyə imkan verir.
Həftənin xəbərləri

