Microsoft mətni 90 dəqiqəlik podkasta çevirən açıq mənbəli süni intellekti təqdim edib (VİDEO)

Süni İntellekt

27.08.2025

Emil Nəcəfov

Microsoft süni intellekt sahəsində açıq mənbəli VibeVoice layihəsini təqdim edib - bu, mətndən ingilis və ya çin dilində 90 dəqiqəyə qədər audio-podkastlar yarada bilən yeni nitq sintezi sistemidir. Texnologiya artıq istənilən şəxs üçün onlayn və ya istifadəçinin lokal cihazına quraşdırmaqla test üçün əlçatandır. Tərtibatçılar VibeVoice-u birbaşa mətndən uzunmüddətli audio-kontent və bir neçə iştirakçı ilə generasiya üçün yaradılmış innovasiyalı framework kimi xarakterizə ediblər. Sistem ənənəvi nitq sintezatorlarının (TTS) əsas problemlərini - miqyaslana bilmə, səs xüsusiyyətlərinin sabitliyi və dialoqda replikanın təbii ardıcıllığını həll edir. Model 90 dəqiqəyə qədər audio sintez edə bilir və burada 4 unikal səs iştirak edə bilər ki, bu da bir çox əvvəlki süni intellekt modellərinə xas olan 1-2 spiker məhdudiyyətini aşır.

Hazırda test üçün modelin iki versiyası əlçatandır: 1.5 və 7 milyard parametrli. Birinci versiya 64 000 token kontekst uzunluğu ilə 90 dəqiqəyə qədər audio yarada bilir, daha böyük ölçüsünə görə keyfiyyətcə üstün olduğu güman edilən ikinci versiya isə 45 dəqiqəlik audio və 32 000 tokenlik pəncərə ilə məhdudlaşır. Bundan əlavə, real vaxt rejimində işləmək üçün nəzərdə tutulmuş 0.5 milyard parametrli yüngülləşdirilmiş versiyanın da buraxılması gözlənilir. Lokal istifadə üçün kiçik model təxminən 7 GB VRAM tələb edir, daha böyük model isə 18 GB-a qədər VRAM tələb edə bilər. Hazırda VibeVoice süni intellekt modeli yalnız ingilis və çin dillərində, o cümlədən mandarin variantında (şimali çin dili) təlim keçirilib.

Lakin Microsoft bildirir ki, gələcək versiyalarda digər dillərin dəstəklənməsi planlaşdırılır. Sistem emosiyaları ötürməyə, iştirakçılar arasında replikaların dəyişməsini idarə etməyə və təbii dialoqlar yaratmağa qadirdir, baxmayaraq ki, musiqi ifa etmək cəhdləri hələ uğursuz qalır. Səslər kifayət qədər realistik səslənsə də, onların süni mənşəyi nəzərə çarpır. Gələcəkdə tərtibatçılar səs klonlama funksiyasının inteqrasiyasını da nəzərdən keçirirlər. Onların sözlərinə görə, axın rejimində audio generasiya istifadəyə verildikdə, VibeVoice xarici serverlərə ehtiyac olmadan çat-assistentlərə inteqrasiya oluna bilər. Əlavə məlumatlar, quraşdırma və sazlama üzrə təlimatlar GitHub-dakı VibeVoice repozitoriyasında və Hugging Face platformasında əlçatandır.

Linki kopyala

microsoft vibevoice

microsoft

artificial intelligence

suni zeka

suni intellekt

Bənzər xəbərlər

Oxşar xəbərlər

OpenAI Microsoft ilə danışıqlar səbəbilə milyardlarla dollar investisiyalardan məhrum ola bilər

Tech-Biznes

OpenAI Microsoft ilə danışıqlar səbəbilə milyardlarla dollar investisiyalardan məhrum ola bilər

Microsoft şirkəti OpenAI-nin ən böyük investoru olaraq qalır, lakin təşkilati struktur və qarşılıqlı əməkdaşlıq şərtlərinin bəzi məqamları şirkətin inkişafı üçün əlavə vəsait cəlb etmək imkanlarını məhdudlaşdırır.

Tech-Biznes

27.08.2025

ChatGPT 16 yaşlı yeniyetmənin intiharında günahlandırılır

Süni İntellekt

ChatGPT 16 yaşlı yeniyetmənin intiharında günahlandırılır

OpenAI rəhbərliyi ChatGPT-nin həssas xarakterli vəziyyətlərdə işləyərkən yaranan nasazlıqların aradan qaldırılması planları barədə ətraflı məlumat verib. Şirkət bu məsələyə o zaman diqqət ayırdı ki, bir yeniyetmənin intiharından sonra ailəsi şirkətə qarşı məhkəmə iddiası qaldırdı.

Süni İntellekt

27.08.2025

Meta-nın süni intellekt şöbəsi artıq mütəxəssislərini itirməyə başlayıb

Süni İntellekt

Meta-nın süni intellekt şöbəsi artıq mütəxəssislərini itirməyə başlayıb

Ən azı 3 süni intellekt tədqiqatçısı, şirkətin baş direktoru Mark Zuckerberg-in cəmi 2 ay əvvəl yaradıldığını elan etdiyi Meta Superintelligence Lab (MSL) bölməsindən ayrılıb.

Süni İntellekt

27.08.2025

Hakerlər süni intellekt üçün şəkillərə zərərli sorğuları yerləşdirməyi öyrəniblər

Təhlükəsizlik

Hakerlər süni intellekt üçün şəkillərə zərərli sorğuları yerləşdirməyi öyrəniblər

Prompt injection hücumu - süni intellekt sisteminə verilən təlimatları insan operatoru üçün görünməz etmək üsuludur. Trail of Bits tədqiqatçıları müəyyən ediblər ki, bu cür təlimatları şəkillərdə elə gizlətmək mümkündür ki, mətn insan gözünə görünməz olur.

Təhlükəsizlik

27.08.2025

Süni intellekt İT sahədə karyera startını çətinləşdirib

Süni İntellekt

Süni intellekt İT sahədə karyera startını çətinləşdirib

Stenford Universitetinin yeni araşdırması göstərir ki, süni intellekt alətləri proqram təminatının hazırlanması və müştəri xidməti sahəsində yeni başlayanların iş tapmasını çətinləşdirir.

Süni İntellekt

27.08.2025

Həftənin xəbərləri

Süni intellekt əsaslı axtarış sistemləri məşhur olmayan mənbələrə daha çox üstünlük verirlər

NVIDIA bazar dəyəri 5 trilyon dollara çatmış ilk şirkət oldu