Las innovaciones en inteligencia artificial no dejan de sorprender y casi a diario aparece algĂşn avance sorprendente. Una de las Ăşltimas novedades es una tecnologĂa capaz de replicar cualquier voz humana en segundos. Una herramienta que conlleva serios riesgos.
Open AI, la empresa dirigida por Sam Altman, acaba de publicar un artĂculo en el que introduce a Voice Engine, un motor de inteligencia artificial capaz de crear un clon digital de una voz humana partiendo sĂłlo de un pequeño clip de audio de 15 segundos.
Este sistema no es nuevo, ya que viene siendo probado por la propia OpenAI desde 2022 en funciones como el sistema de voz de ChatGPT. Lo novedoso es la capacidad de crear nuevas voces partiendo simplemente de un pequeño archivo de audio de una persona.
Desde OpenAI señalaron que Voice Engine está todavĂa en desarrollo. Sin embargo, tambiĂ©n reconocen que son conscientes del problema de este tipo de herramientas, al ser muy fácil usarlas para crear desinformaciĂłn a un nivel que muchas personas aĂşn no serĂan capaces de distinguir.
Desde que se dio a conocer este software, desde OpenAI indican que, hubo muchos casos de estafas que usaron una tecnologĂa similar para replicar las voces de los usuarios o de personas reconocidas.
Fue esta misma razĂłn la que impidiĂł que este servicio se haya liberado masivamente. OpenAI está analizando cĂłmo evitar que se convierta en un problema y hasta que no haya encontrado una soluciĂłn no será una caracterĂstica de libre acceso.
SegĂşn la compañĂa, este sistema puede convertir texto a voz para crear voces sintĂ©ticas que conservan los acentos nativos de los hablantes, algo en lo que la inteligencia artificial viene dando importantes avances.
Incluso, hay otras firmas, como es el caso de Meta, que ya habĂan mostrado sus avances en este campo, OpenAI fue capaz de ir un paso más allá y reducir drásticamente la duraciĂłn del audio de referencia para que la IA copie la voz de una persona.
Su funcionamiento, al menos en teorĂa, es bastante simple. El interesado deberá proporcionar una grabaciĂłn de voz de 15 segundos de duraciĂłn y un texto. La IA será capaz de «clonar» la voz y narrar el contenido del texto de manera «realista y emotiva».
Voice Engine: algunos usos favorables
Pero no todas son contraindicaciones. Entre los usos que ha destacado la empresa está el de asistir a personas con algún tipo de discapacidad en la lectura de textos o a la hora de enseñar a niños. La naturalidad de las voces creadas es uno de sus puntos fuertes.
TambiĂ©n tiene un gran uso en la traducciĂłn y el aprendizaje de nuevos idiomas. Las voces creadas no sĂłlo sirven en el idioma en el que han sido entrenadas, sino que pueden ser usadas para leer o hablar en otros idiomas, pero manteniendo las caracterĂsticas de dichas voces.
Por el momento OpenAI está trabajando con ciertas empresas y desarrolladores que proponen diferentes usos y dan feedback. Eso sĂ, tienen prohibido la creaciĂłn de herramientas que permita a los usuarios crear sus propias voces. Esto es asĂ solo por una cuestiĂłn de seguridad, sobre todo en un año con tantas elecciones como este.
SL