Umělá inteligence na Západočeské univerzitě načetla knihu hlasem Karla Gotta

Komerční prezentace Aktualizace: 11.07.2023 13:51 Vydáno: 11.07.2023, 13:51

Zpěvák Karel Gott na snímku z 19. března 2018. ČTK/Deml Ondřej

Plzeň - Autobiografická kniha Karla Gotta Má cesta za štěstím z roku 2021 získala zvukovou podobu, v níž zpěvákův hlas rozezněla umělá inteligence. Knihu načetla spolu s hercem Igorem Barešem. Český rozhlas (ČRo) a Karel Gott Agency ji představí ve čtvrtek 13. července, v předvečer zpěvákových nedožitých 84. narozenin. Projekt GOTT NAVŽDY by nevznikl bez katedry kybernetiky Západočeské univerzity (ZČU), řekl ČTK mluvčí ZČU Pavel Korelus.

"V roce 1939 se v Plzni narodil Karel Gott, v roce 2023 se na naší univerzitě znovu zrodil jeho hlas," uvedl. ČRo se podle Koreluse na tým syntézy řeči výzkumného centra NTIS Fakulty aplikovaných věd ZČU obrátil koncem loňského roku. "Myslím, že v podmínkách a časových možnostech, jaké byly, jsme dosáhli výborného výsledku," řekl vedoucí týmu Jindřich Matoušek.

Katedra kybernetiky ZČU pracuje s technologií syntézy řeči od 90. let. Z poslední doby je známý například její projekt automatické konzervace hlasu, který vznikl hlavně na pomoc nemocným, jimž hrozí, že přijdou o hlas. "S 1. Lékařskou fakultou UK a softwarovými firmami SpeechTech a CertiCon jsme navrhli proces, kterým si lidé doma nahrají svůj hlas, dokud ještě mohou hovořit, a my z nahrávek vytvoříme jeho kopii, jíž pak promlouvají z různých přístrojů. Tyto zkušenosti jsme využili i při vytváření hlasu Karla Gotta," řekl Matoušek.

Fakultu aplikovaných věd ZČU oslovil ČRo prostřednictvím její spin-off firmy SpeechTech, s níž spolupracuje na zavádění hlasových technologií založených na umělé inteligenci. "Vědci museli během jednoho až dvou měsíců dokázat, že vytvoří co nejvěrnější kopii Gottova hlasu. Data jim poskytl rozhlasový archiv, neboť zpěvák v letech 2011 až 2015 na stanici Dvojka moderoval vlastní pořad Zpátky si dám tenhle film," uvedl Korelus. Dostali 200 hodin nahrávek. "Po prostříhání zbylo asi 20 hodin záznamu bez šumu, slov v cizím jazyce nebo písní v podkresu," řekl Matoušek. První ukázku ČRo představil podle Koreluse vdově Ivaně Gottové, která loni v prosinci rozhodla, že se bude pokračovat. "V lednu a únoru jsme už odevzdávali první a začátkem června poslední kapitolu," uvedl.

Na rekonstrukci hlasu pracoval šestičlenný tým. "Na základě nahrávek a odpovídajících přepisů jsme pak mohli natrénovat model syntézy řeči založený na moderních hlubokých neuronových sítích tak, že hlasem Karla Gotta přečte zadaný psaný text," řekl vědec. Hlas nakonec vznikl v šesti verzích, z nichž mohl ČRo vybírat. "Díky tomu, že zvuk ještě prošel náročnou postprodukcí, zní finální produkt asi nejlépe, jak znít mohl," uvedl.

Podle Matouška tím ČR ukázala, že umí dělat výzkum a vývoj řečových technologií i umělé inteligence na světové úrovni. "Aby byl počítačový hlas plnohodnotným partnerem člověka v hlasovém dialogu, nestačí jen přečíst daný text. Syntéza musí také dokonale porozumět tématu konverzace, umět vyjádřit postoj mluvčího, náladu, emoce, mít paměť… Takové úlohy na řešení teprve čekají," řekl.

Četbu na pokračování odvysílá ČRo Dvojka o prázdninách, bude mít 49 dílů. Celkem je dílů 73 a v nezkrácené podobě vyjdou v audioknize na podzim. ČRo připravil projekt GOTT NAVŽDY ke 100. výročí zahájení pravidelného vysílání na území republiky.

ČR školy hudba média pop Plzeň vysoké školy Gott ČRo AI