“Microsoft” istənilən şəxsin səsini yamsılayan neyron şəbəkə yaradıb

11-01-2023, 11:18           
“Microsoft” istənilən şəxsin səsini yamsılayan neyron şəbəkə yaradıb
“Microsoft” cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.

Digər insanların səslərinin müxtəlif vəziyyətlərdə necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” nitqinin necə səslənəcəyini təxmin edir. Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.

VALL-E-nin yaradılması zamanı EnCodec audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib. Hər iki məhsul “Meta” korporasiyasına məxsusdur.

“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.

Mənbə: gazeta.ru












Teref.az © 2015
TEREF - XOCANIN BLOQU günün siyasi və sosial hadisələrinə münasibət bildirən bir şəxsi BLOQDUR. Heç bir MEDİA statusuna və jurnalist hüquqlarına iddialı olmayan ictimai fəal olaraq hadisələrə şəxsi münasibətimizi bildirərərkən, sosial media məlumatlarındanda istifadə edirik! Nurəddin Xoca
Məlumat internet səhifələrində istifadə edildikdə müvafiq keçidin qoyulması mütləqdir.
E-mail: n_alp@mail.ru