
Microsoft mətni 90 dəqiqəlik podkasta çevirən açıq mənbəli süni intellekti təqdim edib (VİDEO)
Süni İntellekt
27.08.2025
Emil Nəcəfov
Microsoft süni intellekt sahəsində açıq mənbəli VibeVoice layihəsini təqdim edib - bu, mətndən ingilis və ya çin dilində 90 dəqiqəyə qədər audio-podkastlar yarada bilən yeni nitq sintezi sistemidir. Texnologiya artıq istənilən şəxs üçün onlayn və ya istifadəçinin lokal cihazına quraşdırmaqla test üçün əlçatandır. Tərtibatçılar VibeVoice-u birbaşa mətndən uzunmüddətli audio-kontent və bir neçə iştirakçı ilə generasiya üçün yaradılmış innovasiyalı framework kimi xarakterizə ediblər. Sistem ənənəvi nitq sintezatorlarının (TTS) əsas problemlərini - miqyaslana bilmə, səs xüsusiyyətlərinin sabitliyi və dialoqda replikanın təbii ardıcıllığını həll edir. Model 90 dəqiqəyə qədər audio sintez edə bilir və burada 4 unikal səs iştirak edə bilər ki, bu da bir çox əvvəlki süni intellekt modellərinə xas olan 1-2 spiker məhdudiyyətini aşır.

Hazırda test üçün modelin iki versiyası əlçatandır: 1.5 və 7 milyard parametrli. Birinci versiya 64 000 token kontekst uzunluğu ilə 90 dəqiqəyə qədər audio yarada bilir, daha böyük ölçüsünə görə keyfiyyətcə üstün olduğu güman edilən ikinci versiya isə 45 dəqiqəlik audio və 32 000 tokenlik pəncərə ilə məhdudlaşır. Bundan əlavə, real vaxt rejimində işləmək üçün nəzərdə tutulmuş 0.5 milyard parametrli yüngülləşdirilmiş versiyanın da buraxılması gözlənilir. Lokal istifadə üçün kiçik model təxminən 7 GB VRAM tələb edir, daha böyük model isə 18 GB-a qədər VRAM tələb edə bilər. Hazırda VibeVoice süni intellekt modeli yalnız ingilis və çin dillərində, o cümlədən mandarin variantında (şimali çin dili) təlim keçirilib.
Lakin Microsoft bildirir ki, gələcək versiyalarda digər dillərin dəstəklənməsi planlaşdırılır. Sistem emosiyaları ötürməyə, iştirakçılar arasında replikaların dəyişməsini idarə etməyə və təbii dialoqlar yaratmağa qadirdir, baxmayaraq ki, musiqi ifa etmək cəhdləri hələ uğursuz qalır. Səslər kifayət qədər realistik səslənsə də, onların süni mənşəyi nəzərə çarpır. Gələcəkdə tərtibatçılar səs klonlama funksiyasının inteqrasiyasını da nəzərdən keçirirlər. Onların sözlərinə görə, axın rejimində audio generasiya istifadəyə verildikdə, VibeVoice xarici serverlərə ehtiyac olmadan çat-assistentlərə inteqrasiya oluna bilər. Əlavə məlumatlar, quraşdırma və sazlama üzrə təlimatlar GitHub-dakı VibeVoice repozitoriyasında və Hugging Face platformasında əlçatandır.
Linki kopyala
Bənzər xəbərlər
Oxşar xəbərlər
OpenAI Microsoft ilə danışıqlar səbəbilə milyardlarla dollar investisiyalardan məhrum ola bilər
OpenAI Microsoft ilə danışıqlar səbəbilə milyardlarla dollar investisiyalardan məhrum ola bilər
Microsoft şirkəti OpenAI-nin ən böyük investoru olaraq qalır, lakin təşkilati struktur və qarşılıqlı əməkdaşlıq şərtlərinin bəzi məqamları şirkətin inkişafı üçün əlavə vəsait cəlb etmək imkanlarını məhdudlaşdırır.
ChatGPT 16 yaşlı yeniyetmənin intiharında günahlandırılır

ChatGPT 16 yaşlı yeniyetmənin intiharında günahlandırılır
OpenAI rəhbərliyi ChatGPT-nin həssas xarakterli vəziyyətlərdə işləyərkən yaranan nasazlıqların aradan qaldırılması planları barədə ətraflı məlumat verib. Şirkət bu məsələyə o zaman diqqət ayırdı ki, bir yeniyetmənin intiharından sonra ailəsi şirkətə qarşı məhkəmə iddiası qaldırdı.
Meta-nın süni intellekt şöbəsi artıq mütəxəssislərini itirməyə başlayıb

Meta-nın süni intellekt şöbəsi artıq mütəxəssislərini itirməyə başlayıb
Ən azı 3 süni intellekt tədqiqatçısı, şirkətin baş direktoru Mark Zuckerberg-in cəmi 2 ay əvvəl yaradıldığını elan etdiyi Meta Superintelligence Lab (MSL) bölməsindən ayrılıb.
Hakerlər süni intellekt üçün şəkillərə zərərli sorğuları yerləşdirməyi öyrəniblər

Hakerlər süni intellekt üçün şəkillərə zərərli sorğuları yerləşdirməyi öyrəniblər
Prompt injection hücumu - süni intellekt sisteminə verilən təlimatları insan operatoru üçün görünməz etmək üsuludur. Trail of Bits tədqiqatçıları müəyyən ediblər ki, bu cür təlimatları şəkillərdə elə gizlətmək mümkündür ki, mətn insan gözünə görünməz olur.
Süni intellekt İT sahədə karyera startını çətinləşdirib

Süni intellekt İT sahədə karyera startını çətinləşdirib
Stenford Universitetinin yeni araşdırması göstərir ki, süni intellekt alətləri proqram təminatının hazırlanması və müştəri xidməti sahəsində yeni başlayanların iş tapmasını çətinləşdirir.
Həftənin xəbərləri

