La empresa de Inteligencia Artificial OpenAI ha presentado este lunes GPT-4o, una nueva versión gratuita, más rápida y con capacidades mejoradas de su popular «chatbot». La compañía ha presentado al público en un acto retransmitido en vivo por Internet su modelo más avanzado hasta la fecha, mejorando a GPT-4 en sus capacidades de texto, audio y visión. La jefa tecnológica de OpenAI, Mira Murati ha declarado que esta versión «mejora sus capacidades en texto, visión y audio» y supone un «gran paso adelante» en su facilidad de uso. El máximo ejecutivo de la compañía, Sam Altman, ha escrito en una pequeña carta que ha publicado en X (antes Twitter) que GPT-4o es «el mejor modelo hasta la fecha», que es «multimodal» y que está disponible para todos los usuarios de ChatGPT, incluidos los del plan gratuito. Altman ha destacado dos cosas dentro del anuncio de OpenAI, el nuevo modelo revolucionario de voz y vídeo y la consecución de una versión gratuita para «poner en manos de la gente herramientas de IA muy capaces». «Estoy muy orgulloso de que tengamos el mejor modelo del mundo disponible de forma gratuita en ChatGPT, sin anuncios», ha escrito en una carta publicada en su cuenta de X. «Nuestra concepción inicial cuando empezamos OpenAI era que crearíamos IA y la utilizaríamos para crear todo tipo de beneficios para el mundo. En lugar de eso, ahora parece que crearemos IA y luego otras personas la utilizarán para crear todo tipo de cosas increíbles de las que todos nos beneficiaremos», ha reflexionado el programador en la carta. Este anuncio llega tan solo un día antes de que Google, rival de OpenAI, haga públicas las mejoras de su herramienta Gemini, que compite con ChatGPT. GPT-4o presenta las novedades más avanzadas y emocionantes de la historia de la empresa tecnológica estadounidense. Según la compañía, este es un producto «más inteligente y rápido que los anteriores» y estará disponible para todos los usuarios de ChatGPT. La inteligencia del producto está «al nivel de GPT-4», según Murati, pero lo mejora en sus capacidades de texto, audio y visión, lo que reduce la latencia de las respuestas, reduciéndolas a un promedio de 320 milisegundos con el nuevo modelo. OpenAI ha sido capaz de crear un modelo con el que es posible conversar por voz como si fuera una persona e interrumpirle mientras responde, creando la sensación de que se habla con un ser humano. La empresa busca ofrecer formas más naturales de conversar con el «chatbot», que es capaz con esta nueva versión de dar respuestas en diferentes tonos de voz y detectar el estado de ánimo de los usuarios. Otra de las novedades más esperadas por los usuarios es la de la traducción instantánea por voz. Una funcionalidad con la que podremos contarle a ChatGPT que estamos hablando con una persona que habla otro idioma para que traduzca la conversación en tiempo real. Además, va a ser posible pasarle al nuevo modelo una fotografía o captura de pantalla para que nos de información sobre ella, pudiendo ser capaz de identificar una raza de perro o un modelo de coche tan solo con una fotografía. Desde que la demo de GPT-4o ha llegado a Estados Unidos los usuarios están fascinados con todo lo que es capaz de hacer el nuevo modelo del «chatbot». Este es capaz de modular sus tonos de voz contando una historia, cantar una canción de la misma forma que lo haría un ser humano o adivinar las operaciones matemáticas que realiza una persona en tiempo real. Todo esto unido a la mejora de las traducciones en tiempo real, que estarán disponibles en su versión gratuita y serán capaces de ayudar a personas que hablan distintos idiomas a mantener una conversación traduciendo al idioma deseado al instante, simplemente usando la voz. Los ejemplos de las nuevas funcionalidades han sido presentados por Sam Altman y Matt Shumer, CEO de OpenAI y OthersideAI respectivamente, y Tom Warren, periodista estadounidense especializado en tecnología. Estas novedades presentadas por OpenAI son las más avanzadas de la compañía hasta la fecha, un modelo sobre el que Altman ha explicado que «sorprende que sea real» por los tiempos de respuesta y expresividad de nivel humano de la IA. «Hablar con un ordenador nunca me había parecido realmente natural, ahora sí», ha asegurado el director ejecutivo de la empresa de Inteligencia Artificial. «El nuevo modo de voz (y vídeo) es la mejor interfaz de computación que he utilizado nunca. Parece la IA de las películas. Todavía me sorprende un poco que sea real. Llegar a tiempos de respuesta y expresividad de nivel humano resulta ser un gran cambio. El ChatGPT original mostraba un indicio de lo que era posible con las interfaces lingüísticas, esta nueva herramienta se siente visceralmente diferente. Es rápido, inteligente, divertido, natural y útil. Hablar con un ordenador nunca me había parecido realmente natural, ahora sí. A medida que añadimos personalización, acceso a tu información, la capacidad de realizar acciones en tu nombre, y mucho más, veo un futuro apasionante en el que podremos utilizar los ordenadores para hacer mucho más que antes», ha declarado Altman, emocionado con la nueva herramienta de voz y vídeo de OpenAI. Los cambios de GPT-4o se asemejan a la versión de Inteligencia Artificial presentada en la película de ciencia ficción «Her» de Spike Jonze, en la que un «chatbot» de audio está diseñado para satisfacer todas las necesidades humanas del usuario, interpretado por Joaquin Phoenix, que se enamora perdidamente del sistema operativo al que presta su voz Scarlett Johansson. «Her», ha publicado Altman en su cuenta de X. Un mensaje que ya lleva más de 10.000 «me gustas» y 2.000 «retuits».