Inteligencia Artificial
Microsoft presentó un algoritmo que puede clonar su voz en 3 segundos
Investigadores de Microsoft presentaron un nuevo modelo de inteligencia artificial llamado Vall-E, que puede escuchar una voz por pocos segundos para luego imitarla y decir cualquier cosa suplida a manera de texto.
Aunque ya existen varios algoritmos que graban la voz de la persona y la clonan para poder decir palabras que esta persona nunca antes dijo, es la primera vez que uno de estos modelos lo hace usando apenas 3 segundos de audio original.
El algoritmo fue entrenado usando 60,000 horas de inglés hablado, al parecer tomados de narradores de audiolibros. Los resultados son sorprendentes y en algunos casos es muy difícil distinguir entre la voz original y su clon.
Una de las ventajas de Vall-E (además del corto tiempo que necesita para analizar) es que recrea también el ambiente de audio del original. Por ejemplo, si se escucha que el original fue vía teléfono, el algoritmo recrea también ese sonido de fondo particular.
Además pareciera muy bueno reconociendo acentos entre el americano, británico o inglés con otros acentos europeos.
Vall-E no está abierto aún para el público, pero puede escuchar los ejemplos de audio en esta página.
Consultor en Comunicación Digital con 20 años de experiencia en marketing y publicidad. Locutor y co-presentador de TecToc Radio.
Comentarios
- Inteligencia Artificial3 días ago
OpenAI acelera el desarrollo de GPT-5, con un lanzamiento previsto para mediados de año
- Noticias3 días ago
¿Usa estados de Whatsapp? Vienen sorpresas
- Apple2 días ago
Estados Unidos demanda a Apple por prácticas monopólicas con el iPhone
- Apple3 días ago
Supervisor de empresa de entregas se robó productos Apple por más de $1 millón