В Google машину научили "говорить" не хуже человека

28 декабря, 2017 четверг, 11:48

Google разработала продвинутый синтезатор речи нового поколения Tacotron 2, который основан на нейросети

Об этом пишет TechCrunch.

Сообщается, что система преобразования текста в естественный для уха язык Tacotron 2 выполняет эту задачу эффективнее своих предшественников Tacotron и WaveNet.

Предыдущие системы генерации речи имели ряд существенных недостатков. WaveNet, к примеру, выдавала очень резкие звуки. Tacotron лучше справлялся с интонациями, но не мог выдавать полноценный "речевой продукт".

Алгоритм Tacotron 2, который представлен командой разработчиков Google с участием Джонатана Шэна, работает на основе двух нейронных сетей.

Печатная версия конвертируется в специальную Tacotron-спектрограмму, в которой распределяются ритм и ударения, а слова генерируются в аналоге WaveNet. Кроме того, добавлена система сбора данных для обучения нейросети.

Звук действительно похож на язык живого человека. Темп речи звучит довольно убедительно, а основные задержки происходят на словах с необычным произношением. Правда, часть слушателей в комментариях утверждает, что некоторые слова система произносит "ломано".

Образцы работы Tacorton 2 можно прослушать на официальном сайте Google. Эта технология, скорее всего, сразу начнет использоваться в продуктах компании.

Одной из основных проблем нового алгоритма является отсутствие регулировки тона речи. Нельзя предсказать, какая фраза будет произнесена возвышенно, а какая — грубо.

Искусственный интеллект создал собственную религию: физик Джанель Шейн с помощью нейросети решила проверить, что будет, если совместить несколько человеческих верований и свести их в единую систему
Ученые загрузили "мозг" червя в робота, и тот в одиночку взял его под контроль: ученые создали биологически достоверную модель нейронной сети круглого червя и загрузили в простого робота из Lego.
Лаборатория реактивного движения NASA в Калифорнии провела эксперимент, чтобы выяснить, кто быстрее и лучше управляет беспилотным летательным аппаратом - искусственный интеллект или профессиональный пилот.
Ученые Калифорнийского университета научили искусственный интеллект определять, как будут развиваться отношения пары, основываясь на записи их голосов.
Ученые научили искусственный интеллект интерпретировать простейшие эскизы и превращать их в серьезные художественные работы.