Fotomontaje inspirado en ChatGPT

Fotomontaje inspirado en ChatGPT Manuel Ramírez

Noticias y novedades

ChatGPT se actualiza con o3-pro, el nuevo modelo de IA más capaz de OpenAI: no da tregua a Gemini 2.5 Pro de Google

OpenAI vuelve a la carga contra Google y hace unas horas ha anunciado o3-pro, una versión mejorada de su modelo de razonamiento de IA o3.

Más información: ChatGPT ha estado caído en España durante horas: un cese de servicio que dejó a millones de usuarios sin su IA favorita

Publicada

Después del acuerdo sin precedentes entre OpenAI y Google, ahora la primera acaba de lanzar o3-pro, un modelo de IA que la compañía clama que es el más capaz hasta el momento.

O3-pro es una versión del modelo de razonamiento o3 de OpenAI que la startup lanzó a principios de este año. Un tipo de modelo que, al revés que los convencionales de IA, desarrolla los problemas paso a paso.

Esto le permite rendir mucho mejor en materias como la física, las matemáticas y la codificación. Un salto hacia adelante que pega ChatGPT para batirse en duelo con Gemini 2.5 Pro actualizado hace días y Claude 4 Opus de Anthropic.

O3-pro ya está disponible para los usuarios que pagan por la suscripción Pro y Team de ChatGPT desde ayer martes, y sustituye al modelo o1-pro. Los usuarios de Enterprise y Edu tendrán acceso la próxima semana.

La API para desarrolladores ya cuenta con o3-pro desde hace horas. O3-pro tiene un coste de 20 dólares por un millón de tokens de entrada y 80 dólares por millón de tokens de salida en la API.

Para entender mejor estas cifras, un millón de tokens equivale a cerca de 750.000 palabras, un poco más que una novela como Guerra y paz de Lev Tolstói. Las compañías de IA cobran a terceros por la generación del texto a través de estos tokens.

Y ahora lo interesante, el rendimiento de o3-pro. OpenAI mantiene que, según las evaluaciones de los expertos, prefieren o3-pro sobre o3 en toda categoría probada, y especialmente en materias clave como ciencia, educación, programación, negocio y escritura.

Así queda o3-pro frente a otros modelos de OpenAI

Así queda o3-pro frente a otros modelos de OpenAI OpenAI

Hay otro punto clave en o3-pro, y es su acceso a las herramientas como la búsqueda en web, análisis de archivos, razonamiento sobre entradas visuales, es capaz de usar Python, personaliza sus respuestas y más.

Hay varias limitaciones en la nueva experiencia según cita la startup desde su web. Uno es que el modelo tarda un poco más en responder que o1-pro, según mantiene OpenAI.

Otro es que los chats temporales están desactivados mientras se resuelve un problema técnico. Y tanto la generación de imágenes con IA como el uso de Canvas, su función de espacio de trabajo, no están soportadas por o3-pro.

La siguiente pregunta que nos hacemos es cómo rinde frente a otros modelos para poder encajar realmente su capacidad: o3-pro logra puntuaciones impresionantes en los benchmarks de IA más populares.

En AIME 2024, según TechCrunch, una prueba capaz de evaluar las habilidades matemáticas del modelo, o3-pro puntúa mejor que Gemini 2.5 Pro, el modelo de IA top de Google. O3-pro también bate a Claude 4 Opus en GPQA Diamond.

Todavía no disponemos de una tabla comparativa en la que podamos apreciar las diferencias con los modelos de IA mencionados al igual que la última actualización de DeepSeek R1 que llegó hace unas semanas.