Главная Общество Украинские изобретатели научили искусственный интеллект имитировать голос человека

Украинские изобретатели научили искусственный интеллект имитировать голос человека

22 декабря, 2019 воскресенье

13:16

Одна из украинских компаний уже два года работает над искусственным интеллектом, способным синтезировать голос любого человека. Не без успеха. У компании уже есть контракт с голливудской студией, которая применяет эту технологию в кино, а видео, которые наглядно демонстрируют новые возможности, собирают сотни тысяч просмотров на Youtube

client/title.list_title

Подробициз ссылкой на ВВС рассказывает Еспресо.TV.

Работает данная технология следующим образом. Для начала нужны две аудиодорожки: на одной - запись Вашего голоса, на другой - запись актера, слово в слово повторяет произнесенный Вами текст.

На этом этапе программа тренируется: сравнивает обе записи и обнаруживает, чем один голос отличается от другого.

Теперь, когда искусственный интеллект понимает разницу, он способен превращать голос актера в ваш - какой бы текст он не зачитывал.

Чтобы программа сработала эффективно, ей нужно проанализировать крайней мере час записи целевого голоса - того, который надо сымитировать. С высокой вероятностью за это время она услышит достаточное разнообразие слов и звукосочетаний, проанализирует особенности целевого голоса и поймет, как их следует воспроизводить.

Что это за голоса, говорит основатель проекта Александр Сердюк, неважно: низкий голос можно превратить в высокий, мужской в женский, а детский во взрослый.

"На рынке есть два основных подхода к синтезированию голоса. Большинство продуктов работает по принципу text to speech, когда голос генерируется из текста. Мы принципиально от них отличаемся: Respeecher синтезирует нужный голос с голоса другого человека", - объясняет Сердюк.

"Такой подход более эффективен. Когда ты генерируешь голос из текста, твои возможности очень ограничены. Ты не имеешь возможности контролировать эмоциональную окраску голоса и результат получается несколько механическим. У нас эту проблему решает актер, который может подобрать нужные интонации.

Кроме того, инструменты, которые синтезируют голос из текста, иногда нуждаются в до 20 часах записи целевого голоса - именно столько им нужно, чтобы натренировать искусственный интеллект. Нам достаточно часа ", - рассказывает Сердюк.

Выступление «голосом» Обамы. Взято с YouTube-канала проекта

Киев

+20.6°C

Киев
Львов
Винница
Днепр
Донецк
Житомир
Запорожье
Ивано-Франковск
Кропивницкий
Луганск
Луцк
Николаев
Одесса
Полтава
Ровно
Сумы
Симферополь
Тернополь
Ужгород
Харьков
Херсон
Хмельницкий
Черкасси
Черновцы
Чернигов
Белая Церковь

Актуальное
Важное

Больше новостей

Про нас

Перепечатка и иное использование материалов, размещенных на сайте разрешается при условии ссылки на espreso.tv. Интернет-издания могут использовать материалы сайта, размещать видео при условии ссылки на espreso.tv. Запрещено копирование и использование материалов, в которых содержится ссылка на агентства Интерфакс-Украина, УНИАН, Reuters, Associated Press. Материалы обозначены меткой "Реклама", "Новости компаний", "Пресс-релиз", "PR", "Партнерский материал" публикуются на правах рекламы, по вопросам рекламы обращайтесь по адресу [email protected]. Курсы валют предоставлены kurs.com.ua