Od 08. oktobra 2020. na sajtu RTS-a mogu da se preslušaju vesti uz pomoć AlfaNum-ovog najnovijeg sintetizatora baziranog na dubokim neuronskim mrežama, za koji je glas dao spiker, radijski i televizijski voditelj Dragan Vučelić dobitnik nagrade Radio-televizije Srbije za lepotu govora.
Ovaj tim koji je potekao sa Fakulteta tehničkih nauka u Novom Sadu, razvio je sintetičke, muške i ženske glasove za srpski, hrvatski i crnogorski jezik.
Korišćenjem tehnologije za konverziju govora od malog uzorka nečijeg glasa AlfaNum za dve nedelje sintetizuje glas koji zvuči veoma slično glasu osobe čiji je snimak uzet kao osnova.
Primer za to je glas kojim govori digitalni asistent Rajfajzen banke REA.
Osvajanjem ove tehnologije korišćenjem veštačke inteligencije stvorena je mogućnosti za razvoj aplikacija koje mogu da pomognu licima sa raznim oblicima invaliditeta kao i za razvoj velikog broja drugih aplikacija.
Pomenućemo audio knjige, aplikacije za online nastavu koja je jako potrebna u sistemu obrazovanja, zvučna obaveštenja u kontakt centima u automobilskoj industriji u robotici i td.
Prošle godine portovana je sinteza na Android OS. Sva slepa i slabovida lica u Srbiji su dobila mogućnost da besplatno koriste ovu aplikaciju koja omogućava jednostavnu upotrebu svih funkcija uređaja koji koriste Android OS na maternjem jeziku.
AlfaNum tim je radio i na unapređenju automatskog prepoznavanja govora, takođe baziranog na dubokim neuronskim mrežama.
Zahvaljujući tome završen je Sistem za automatsko prepoznavanje govora za diktiranje medicinskih nalaza za potrebe PIO Fonda koji će ubuduće olakšati rad lekara koji neće više gubiti vreme na kucanje dijagnoza.
Ovako unapređene govorne tehnologije danas omogućavaju znatno širu primenu u poslovnom i privatnom okruženju kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.
Ostavljanje komentara je privremeno obustavljeno iz tehničkih razloga. Hvala na razumevanju.