
Спочатку програма тренується: порівнює обидва записи і виявляє, чим один голос відрізняється від іншого.
Українські винахідники навчили штучний інтелект імітувати голос іншої людини
Одна з українських компаній вже два роки працює над штучним інтелектом, здатним синтезувати голос будь-якої людини. Не без успіху. У компанії вже є контракт із голлівудською студією, яка застосовує цю технологію в кіно, а відео, що наочно демонструють нові можливості, збирають сотні тисяч переглядів на Youtube
Подробиціз посиланням на ВВС розповідає Еспресо.TV.
Працює дана технологія наступним чином. Для початку потрібні дві аудіодоріжки: на одній - запис Вашого голосу, на іншій - запис актора, який слово в слово повторює вимовлений Вами текст.
На цьому етапі програма тренується: порівнює обидва записи і виявляє, чим один голос відрізняється від іншого. Тепер, коли штучний інтелект розуміє різницю, він здатен перетворювати голос актора на ваш - який би текст той не зачитував.
Аби програма спрацювала ефективно, їй потрібно проаналізувати принаймні годину запису цільового голосу - того, який треба зімітувати.
Аби програма спрацювала ефективно, їй потрібно проаналізувати принаймні годину запису цільового голосу - того, який треба зімітувати. З високою ймовірністю за цей час вона почує достатнє різноманіття слів та звукосполучень, проаналізує особливості цільового голосу та зрозуміє, як їх варто відтворювати.
Що це за голоси, каже засновник проекту Олександр Сердюк, немає значення: низький голос можна перетворити на високий, чоловічий на жіночий, а дитячий на дорослий.
«На ринку є два основні підходи до синтезування голосу. Більшість продуктів працює за принципом text to speech, коли голос генерується з тексту. Ми принципово від них відрізняємось: Respeecher синтезує потрібний голос з голосу іншої людини», - пояснює Сердюк.
