joi. apr. 18th, 2024

Inteligența artificială care ”îți fură” vocea după doar câteva cuvinte. Microsoft a dezvoltat un model de limbaj ce poate realiza o performanță uluitoare: are nevoie de doar trei secunde să-ți asculte vocea pentru a ți-o imita. Dar simulatorul de voce nu este disponibil publicului larg dintr-un motiv foarte justificat.

Inteligența artificială care ”îți fură” vocea după doar câteva cuvinte

Inteligența Artificială își dovedește utilitatea și într-o zonă ce implică replicarea vocii umane. Microsoft a prezentat un simulator de voce care folosește inteligența artificială și este capabil să îți imite vocea după ce o ascultă timp de numai trei secunde.

Simulatorul folosește modelul VALL-E dezvoltat pe baza celor mai recente cercetări în domeniul text-to-speech AI. VALL-E este ceea ce Microsoft numește „model de limbaj de codec neuronal”. Este derivat din Encodec-ul rețelei neurale de compresie alimentat de AI al Meta, care generează sunet din introducerea textului și mostre scurte de la fișierul audio țintă.

În procesul de dezvoltare a soluției au fost folosite 60.000 de ore de conversații în limba engleză, susținute de 7.000 de persoane, în așa fel încât soluția să fie capabilă să ofere o calitate ridicată a felului în care reproduce vocea participanților, scrie arstechnica.com.

Odată ce soluția care folosește inteligența artificială aude vocea unei persoane este capabilă să o reproducă în așa fel încât poate spune orice folosind vocea persoanei respective, fiind capabilă chiar și de copierea tonului pe care persoana respectivă îl are sau zgomotul de fundal.

sursa aici

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *