Connect with us

Inteligencia Artificial

Microsoft presentó un algoritmo que puede clonar su voz en 3 segundos

Published

on

Investigadores de Microsoft presentaron un nuevo modelo de inteligencia artificial llamado Vall-E, que puede escuchar una voz por pocos segundos para luego imitarla y decir cualquier cosa suplida a manera de texto.

Aunque ya existen varios algoritmos que graban la voz de la persona y la clonan para poder decir palabras que esta persona nunca antes dijo, es la primera vez que uno de estos modelos lo hace usando apenas 3 segundos de audio original.

El algoritmo fue entrenado usando 60,000 horas de inglés hablado, al parecer tomados de narradores de audiolibros. Los resultados son sorprendentes y en algunos casos es muy difícil distinguir entre la voz original y su clon.

Una de las ventajas de Vall-E (además del corto tiempo que necesita para analizar) es que recrea también el ambiente de audio del original. Por ejemplo, si se escucha que el original fue  vía teléfono, el algoritmo recrea también ese sonido de fondo particular.

Además pareciera muy bueno reconociendo acentos entre el americano, británico o inglés con otros acentos europeos.

Vall-E no está abierto aún para el público, pero puede escuchar los ejemplos de audio en esta página.

Comentarios

Comentarios

Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending