“No somos solo una voz, somos actitud e intención, y eso aún no lo clona la IA”
Terese Mendiguren, investigadora del grupo Gureiker de la UPV, alerta del avance vertiginoso de la clonación vocal: "una de las voces sintéticas del experimento engañó al 47% del alumnado"
Espacio IA: el uso de las voces artificiales.
Vitoria-Gasteiz
En un contexto de creciente preocupación por el impacto de la inteligencia artificial en los medios y en la vida cotidiana, la creación de voces sintéticas se consolida como uno de los desarrollos más avanzados y, a la vez, más inquietantes. “Cada vez se nota menos la diferencia entre una voz humana y una generada por IA”, ha indicado Terese Mendiguren, miembro del grupo Guriker de la UPV.
Además, ha alertado que "la IA ya es capaz de imitar no solo el timbre de voz, sino también inflexiones, ritmos, dudas, carraspeos y otros matices que antes eran considerados exclusivamente humanos. Casi no hay voz que se le resista. Las simulaciones son brutales”.
¿Estamos cerca de escuchar entrevistas completamente falsas? ¿O de que una máquina sustituya a una locutora profesional? Por ahora, parece que no. “La voz es algo que cambia con la edad, con las emociones, con la experiencia. No somos solo un sonido, somos una actitud, una intención. Y eso, por ahora, la inteligencia artificial no lo puede clonar”, ha remarcado Mendiguren.
A raíz de todo este avance, desde la universidad del País Vasco pusieron en marcha un experimento, con voces reales y artificiales, para los estudiantes de periodismo. Se grabó el mismo texto con siete voces humanas y siete voces artificiales, sin revelar cuál era cuál, y el resultado fue sorprendente, porque "una de las voces sintéticas logró engañar al 47% de los participantes, que pensaron que era real, y eso fue el año pasado, ahora las voces artificiales son aún más sofisticadas, por lo que hay que tener mucho más cuidado", ha destacado Mendiguren.
La preocupación no es infundada, y es que los audios que circulan por redes sociales y mensajería pueden ser recogidos por herramientas de IA para entrenar modelos, muchas veces sin que los usuarios sean conscientes. “Hay que tener cuidado con lo que subimos a la red. Si subes un audio y lo asocias a un nombre, la inteligencia artificial se lo queda”, ha recordado.
¿Voces artificiales en los medios?
Los medios de comunicación ya están experimentando con estas tecnologías. Desde podcasts automatizados hasta boletines narrados por voces sintéticas, como el caso del Carrusel Deportivo, que incorporó a la voz artificial “Victoria”, premiada a nivel internacional. “Cada vez hay más medios que las utilizan para reportajes o noticias automatizadas”, ha indicado Mendiguren, aunque también reconoce que aún se nota cierta diferencia en la interacción humana: “La rapidez, las pausas naturales, el feedback en directo... todavía hay cosas que las máquinas no pueden imitar del todo”.
A pesar del avance, la investigadora del grupo Gureiker de la UPV, lanza un mensaje de equilibrio: “Lo deseable es una convivencia entre voces humanas y sintéticas, sabiendo para qué se usa cada una, y sobre todo que el espectador u oyente sepa que se están utilizando”. Además, hay que reconocer que "la IA vocal puede tener aplicaciones muy positivas en accesibilidad o automatización, siempre que se usen con ética y control", ha destacado Mendiguren.
Jon Dos Santos
Redactor y editor de contenidos en el magazine...Redactor y editor de contenidos en el magazine Hoy por hoy Vitoria