live
Спутник ASTRA-4A 12073 МГц. Поляризация-Н. Символьная скорость 27500 Ксимв/с. FEC 3/4

В Google машину научили "говорить" не хуже человека

Google разработала продвинутый синтезатор речи нового поколения Tacotron 2, который основан на нейросети

Об этом пишет TechCrunch.

Сообщается, что система преобразования текста в естественный для уха язык Tacotron 2 выполняет эту задачу эффективнее своих предшественников Tacotron и WaveNet.

Предыдущие системы генерации речи имели ряд существенных недостатков. WaveNet, к примеру, выдавала очень резкие звуки. Tacotron лучше справлялся с интонациями, но не мог выдавать полноценный "речевой продукт".

Алгоритм Tacotron 2, который представлен командой разработчиков Google с участием Джонатана Шэна, работает на основе двух нейронных сетей.

Печатная версия конвертируется в специальную Tacotron-спектрограмму, в которой распределяются ритм и ударения, а слова генерируются в аналоге WaveNet. Кроме того, добавлена система сбора данных для обучения нейросети.

Звук действительно похож на язык живого человека. Темп речи звучит довольно убедительно, а основные задержки происходят на словах с необычным произношением. Правда, часть слушателей в комментариях утверждает, что некоторые слова система произносит "ломано".

Образцы работы Tacorton 2 можно прослушать на официальном сайте Google. Эта технология, скорее всего, сразу начнет использоваться в продуктах компании.

Одной из основных проблем нового алгоритма является отсутствие регулировки тона речи. Нельзя предсказать, какая фраза будет произнесена возвышенно, а какая — грубо.

Читайте также: Все говорят об искусственном интеллекте. Простыми словами объясним, что это

 

 

новости партнеров

21 сентября, 2018 пятница

20 сентября, 2018 четверг

21 сентября, 2018 пятница

20 сентября, 2018 четверг

19 сентября, 2018 среда

Видео

Введите слово, чтобы начать