• Noticias TIC
cuWhois
Facebook crea una IA capaz de copiar la voz de cualquier persona

Facebook crea una IA capaz de copiar la voz de cualquier persona

  • 11 de junio de 2019

Facebook ha creado un sistema de Inteligencia Artificial capaz de copiar la voz de cualquier persona.

Equipos de investigadores están actualmente probando su algoritmo con la voz de Bill Gates.

Acaban de presentar un nuevo sintetizador de voz, capaz de copiar la voz de cualquier persona del mundo. Este avance tecnológico es una creación de los equipos de investigación de la división IA de Facebook. Una máquina llamada MelNet, que abre el espectro a una nueva era de contenido de audio.

Hasta ahora, el aprendizaje automático se ha esforzado por hacer proezas en el campo de la síntesis del habla. Reproducir modelos de voz reales es algo muy complicado, que requiere una base de datos de audio gigantesca. Sean Vasquez y Mike Lewis, investigadores de la IA de Facebook, han intentado un enfoque diferente a los intentos anteriores.

En lugar de utilizar formas de onda de audio, los dos investigadores utilizaron espectrogramas para formar su red neuronal. La ventaja de los espectrogramas es que registran todo el espectro de frecuencias de audio y su evolución en el tiempo. La información de audio es mucho más densa y permite acercarse al ritmo y la entonación real.

Especifican que: "este sistema de aprendizaje permite que nuestros modelos de espectrograma generen muestras de voz y música incondicionales con una constancia de varios segundos". Los resultados son impresionantes, MelNet es capaz de reproducir la voz de cualquier persona. Se han realizado varias pruebas con la voz de Bill Gates.

Nuevas perspectivas

Recientemente, un equipo de investigación de la Universidad de Zhejiang y Fuxi AI Lab de NetEase ha desarrollando un sistema muy interesante que puede generar animación facial a partir de una pista de audio. Hoy con la invención de la IA de Facebook, la combinación de estas dos inteligencias artificiales podría llevarnos mucho más lejos.

Imagina lo siguiente, que haya hackers que pueden reproducir la voz de Donald Trump y hacer una llamada telefónica a Xi Jinping para tratar de empeorar la relación entre los dos países. Da miedo.

Añade tu comentario