Гугл «заговорил» людским голосом

    Спецы поискового великана Гугл выпустили статью, в какой поведали об фолиант, что сделали генератор речи, могущий твердить неотличимым от живого человека голосом. Технология именуется Tacotron 2 и умеет максимально отменно преобразовывать текст в речь.

    Програмка воображает собой две взаимосвязанные нейросети глубочайшего обучения. Первая нейросеть создаёт на базе текста спектрограмму и передаёт её второму методу WaveNet, который её и оглашает «голосом». Tacotron 2 знает огромное количество аспектов, без усилий совладевает со сложноватыми в произношении словами и, читая с листа, учитывает пунктуацию. Благодаря этому, к примеру, она отличает финал предложения и начало новенького, выделяя них интонацией.

    Эталоны работы приложения спецы уже изложили на странице, посвящённой создании. Звучит это же еще предпочтительнее, чем однообразные механические голоса современных программ озвучивания, потому, нужно предполагать, Гугл резво найдёт создании применение. WaveNet уже употребляется в Гугл Assistant, потому Tacotron 2 наверное станет для неё хорошим дополнением.

    На заданном шаге разработки Tacotron 2 разговаривает лишь наглядным дамским голосом, однако, возможно, в дальнейшем обзаведётся и мужским вариантом, а уж, беря во внимание её способность к обучению, может быть, научится и имитировать альтернативные голоса.