Xiaomi predstavlja govornu tehnologiju namenjenu ljudima sa oštećenjem govora

Xiaomi, kompanija koja se bavi proizvodnjom pametnih telefona i IoT uređaja, predstavila je svoju najnoviju govornu tehnologiju, koja predstavlja primenu naprednih algoritama na polju alata za olakšanu upotrebu. Tehnologija Text-To-Speech koju je razvio Xiaomi AI Lab je sposobna da u stilu svakodnevnog govora generiše jedinstven i prilagođen glas za korisnike sa poremećajima govora.

Ovaj tip korisnika sada može da komunicira sa drugima koristeći “svoj glas”, umesto tipičnog monotonog elektronskog glasa. Kao deo predistraživačkog projekta „Own My Voice“ koji vodi Tehnološki komitet kompanije Xiaomi, ovaj uspešan projekat demonstrira Xiaomi-jevu posvećenost „Tech for Good“ (tehnologiji za dobro drugih) i ostvarivanju svoje misije „da inovativne tehnologije poboljšaju život svima na svetu“.

Zašto je Xiaomi pokrenuo ovaj projekat?

Xiaomi brine o ljudima i nastoji da ispuni njihove različite potrebe kroz tehnološke inovacije. Usled želje mnogih korisnika koji imaju oštećenja govora za posedovanjem sopstvenog glasa za svakodnevnu komunikaciju, osnovan je projektni tim „Own My Voice“ koji je omogućio korisnicima sa oštećenjem govora da koriste usluge Text-To-Speech. Zhu Xi, pokretač ove teme u Komitetu za tehnologiju za Tech for Good, Xiaomi Corporation, rekao je: „Uzbuđeni smo što istražujemo višestruke vrednosti koje nam donose tehnološke inovacije, kao što je odgovaranje na zahteve korisnika za sopstvenim identitetom i izgradnjom identiteta. “

Kako je Xiaomi sproveo projekat?

Pročitajte i tekst: Uživo iz Praga sa regionalne premijere Xiaomi Redmi Note 14 serije telefona

Da bi generisao što prikladniji i personalizovaniji glas korisnicima, projektni tim je angažovao više od 200 volontera u Xiaomi-u kako bi „donirali“ svoje glasove. Koristili su algoritam za podudaranje otiska glasa kako bi uporedili karakteristike glasova volontera sa glasovima primaoca. Ovim pristupom pronašli su najpogodniji glas koji je korišćen kao osnovni zvuk. Uzimajući u obzir personalizaciju i zaštitu privatnosti, izabranim pravim glasom manipulisano je kompleksnom akustičnom modifikacijom da bi se formirao nov i originalan zvuk glasa.

Zatim su koristili tehnologiju Text-To-Speech u stilu svakodnevnog govora kako bi prilagodili AI model, čineći da ovaj novi glas postepeno dobija prirodan ritam i intonaciju koja može istinito da izrazi emociju i ton čoveka.

Projekat „Own My Voice“ kombinuje niz najnaprednijih algoritama sa Xiaomi-jevom samorazvijenom govornom tehnologijom kako bi se osigurala specifičnost, bezbednost i visoka autentičnost sintetizovanog glasa, stvarajući novu ideju o prilagođenoj sintezi govora za korisnike sa smetnjama.

U čemu je značaj ovog projekta?

Okosnicu ovog projekta čini grupa stručnjaka za govornu tehnologiju iz Xiaomi AI Lab. Oni su od 2017. godine objavili 37 radova o govoru u zbornicima vrhunskih međunarodnih konferencija, poput Međunarodne konferencije o akustici, govoru i obradi signala (ICASSP). Uspeh “Own My Voice” uglavnom zavisi od spontanog stila Text-To-Speech tehnologije koju su razvili.

Tehnologija Text-To-Speech u suštini predstavlja sintetizovani glas nalik na ljudski u svojoj intonaciji, pauzi, brzini i drugim karakteristikama. Ovo čini uobičajeno monoton i neprirodan osećaj elektronskog glasa prirodnijim. Trenutno se ova tehnologija primenjuje na mnoge pametne uređaje opremljene funkcijom XiaoAI, AI glasovnim asistentom kompanije Xiaomi. Projekat „Own My Voice“ pokazuje da spontani stil Text-To-Speech tehnologije takođe može biti široko prihvaćen i poboljšati korisničko iskustvo.

Pročitajte i tekst: Prilagođena Xiaomi neto dobit za prvi kvartal 2024. godine iznosi 6,5 milijardi juana

Zhu Xi je dodao: „Ako primetimo i odgovorimo na potrebe manjinskih grupa u ranoj fazi, proces širenja tehnologije mogao bi biti znatno skraćen. Ovo omogućava da prednosti novih tehnologija postanu dostupne korisnicima sa posebnim potrebama bez odlaganja.“

U budućnosti, Xiaomi će nastaviti da dobija povratne informacije od primaoca glasa i dalje proučava izvodljivost ovog projekta u širem opsegu. Xiaomi će nastaviti da osnažuje pristupačnost kroz najsavremeniju tehnologiju, nastojeći da ispuni različite potrebe ljudi kroz tehnološke inovacije.