OpenAI sorprendió al mundo con la última actualziación abierta de del ChatGPT, un nuevo modelo de inteligencia artificial generativa, llamado GPT-4o, con nuevas capacidades de producción y comprensión de textos, imágenes y sonidos. Todo esto de acceso gratuito al público. “Estamos muy entusiasmados de presentar GPT-4o a todos nuestros usuarios gratuitos”, manifestó Mira Murati, directora tecnológica de la start-up Open IA, durante la presentación virtual.
Según la demostración realizada por la empresa el lunes, GPT-4o convertirá ChatGPT en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real. También podrá interactuar mediante texto y “visión”, lo que significa que podrá ver capturas de pantalla, fotos, documentos o gráficos subidos por los usuarios y mantener una conversación sobre ellos.
“Es la primera vez que damos un gran paso adelante en lo que respecta a la facilidad de uso”, declaró Murati durante la demostración en directo desde la sede de la empresa en San Francisco. “Esta interacción se vuelve mucho más natural y mucho, mucho más fácil”.
El nuevo asistente asistente de OpenAI, identificado por la palabra “omni”, es capaz de leer las emociones en los rostros a través de la cámara de su teléfono inteligente, guiarlos para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático, entre otras cosas. Otra característica que destacaron es que tendrá una nueva interfaz, más sencilla y conversacional, y permite preguntar cualquier cosa con sólo usar un atajo de teclado.
Entre otras novedades incluye la transcripción, la inteligencia y la capacidad de hablar reunidas, para aportar el modo vocal; interacción en conversaciones fluidas, reproduciendo de manera asombrosa discusiones entre humanos; lee las emociones en lo rostros de os usuarios a través de la cámara de su teléfono inteligente; también puede guiar a los usuarios para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático; tiene una nueva interfaz, más sencilla y conversacional; y permite preguntar cualquier cosa con sólo usar un atajo de teclado.