210 voces y 4 millones de usuarios: la startup española que revoluciona la comunicación entre jóvenes
La startup pionera en modificar la voz en tiempo real se posiciona como una de las herramientas más innovadoras de la comunicación digital, con más de 4 millones de usuarios mensuales en 192 países
Los Revolucionarios | 210 voces y 4 millones de usuarios: la startup española que revoluciona la comunicación entre jóvenes
Madrid
Hoy ha estado en La Ventana, Jaime Bosch, CEO y cofundador Voicemod, una startup que ha transformado la manera en que los jóvenes se comunican. Bosch ha explicado cómo la tecnología que desarrollaron ha permitido crear una capa adicional de expresión en las conversaciones, especialmente en el ámbito de los videojuegos. Su propuesta es utilizar una inteligencia artificial para modificar la voz en tiempo real.
Con más de 120 filtros y perfiles de voz, Voicemod ha conseguido conectar con los usuarios, permitiéndoles crear experiencias inmersivas y personalizadas. Bosch ha explicado que lo que hacen en Voicemod es "añadir una capa de expresión a una conversación audiovisual o auditiva". "De la misma manera que en un chat expresamos con emojis cosas que no se pueden expresar con palabras, nosotros les ayudamos a que se puedan expresar de una manera parecida, pero en un entorno de audio", indica Bosch.
Además de ofrecer voces creadas por el equipo de Voicemod, la plataforma permite que los usuarios desarrollen sus propias voces, fomentando la creatividad. "Ahora mismo tenemos 210 voces disponibles en nuestra plataforma. Estas voces las ha creado el equipo de Voicemod, pero ahora mismo los usuarios también tienen herramientas para poder crear sus propias voces", ha explicado Bosch.
La clave del éxito de Voicemod es su capacidad para modificar la voz en tiempo real, lo que la distingue de otras tecnologías similares que funcionan mediante IA a partir de texto. "El reto tecnológico que nosotros hemos sido capaces de romper durante estos años es crear modelos de inteligencia artificial que funcionen en una ventana de unos 40 a 60 milisegundos, es decir, son modelos que no conocen lo que vas a decir, por lo tanto, tienen una forma de funcionar muy diferente en cuanto a otro tipo de tecnología en la que tú escribes un texto y ya interpreta con otra voz", ha aclarado el CEO.
A pesar de los temores sobre el uso indebido de estas tecnologías, Voicemod ha implementado medidas de seguridad para proteger los derechos de los usuarios. "Somos la única compañía de audio en tiempo real que tiene un certificado Fairly Trained que garantiza que nuestros modelos están entrenados con datos de los que somos dueños. No estamos entrenando los modelos con voces de nadie que no nos ha dado el permiso para hacerlo. Además, hemos desarrollado una tecnología de marcas de agua en la voz para poder marcar los audios generados de forma sintética", decía.
La adopción de esta tecnología no se limita solo a los jóvenes gamers, ya que la plataforma también está ganando terreno en otros ámbitos, como los streamers y creadores de contenido. "El target de este producto son los gamers, pero también estamos viendo una creciente adopción entre los creadores de contenido", ha comentado.
Con un equipo de 90 personas de diversas disciplinas y nacionalidades, Voicemod sigue innovando y mejorando su tecnología. Su próximo objetivo es expandir su alcance a nuevas plataformas como consolas y móviles, e integrarse con grandes aplicaciones y plataformas tecnológicas. "Nosotros tenemos canales abiertos constantemente con nuestros usuarios para que nos den su feedback y opinen de lo que quieran. Una cosa chula del proyecto es que se puede vincular a eventos que ocurren en el mundo real", ha finalizado Bosch.