Google научила компьютер говорить человеческим звуком, неотличимым от реального

Аудиозапись действительно напоминает язык живого человека, но не машины. Единственная проблема — это то, что компьютерная программа не может в точности повторить интонацию человека.

Компьютерная программа Tacotron 2, разработанная специалистами Google, научилась в точности воссоздавать человеческую речь — со всеми присущими ей нюансами.

Tacotron 2 основывается на нейронных сетях. Эту операцию исполняет первая нейросеть, тогда как 2-ая нейросеть синтезирует на основе спектрограмм речь, пользуясь алгоритмами WaveNet. Tacotron 2 учитывает пунктуацию и умеет интонационно выделять особо главные части предложения. WaveNet считывает зрительные изображения и создаёт соответствующие звуковые субъекты.

На сайте Google можно прослушать аудиозаписи, записанные звуком системы. Человеческая речь оказалась все-таки реалистичней, однако только немного — 4,58 балла. Разницу заметить почти невозможно.

Tacotron 2 способна обрабатывать сложные наименования и имена, а еще изменять интонацию зависимо от пунктуации, что не всегда в состоянии делать обычные системы. Она в состоянии правильно воссоздавать тяжелые для произношения слова и наименования.

Прошлые системы генерации речи обладали рядом существенных дефектов.

Google научила нейросеть говорить с человеческой интонацией


Новости за сегодня:


Обсуждение по теме: