Durante años, hemos hablado del potencial de los agentes de inteligencia artificial. La idea ha rondado en charlas, artículos y prototipos: una IA que no solo hable, sino que actúe, que entienda contextos, que tome decisiones y que sea realmente útil más allá de una conversación. Hoy, esa visión está mucho más cerca de convertirse en una realidad. OpenAI ha dado un paso definitivo en esa dirección con el lanzamiento de ChatGPT Agent, una funcionalidad que convierte a su popular asistente en algo mucho más autónomo, interactivo y útil.
De asistente conversacional a agente autónomo
Hasta ahora, ChatGPT había sido una herramienta impresionante para generar texto, responder preguntas, escribir código o redactar correos. Pero su alcance estaba limitado a lo que pasaba dentro del cuadro de texto. Las instrucciones debían ser claras, paso a paso, y todo el contexto debía estar contenido en la conversación.
Eso acaba de cambiar.
Con ChatGPT Agent, OpenAI introduce una nueva capa de funcionalidad: ahora, este agente puede ejecutar tareas complejas dentro de un entorno controlado que simula un ordenador virtual. Ya no se trata solo de “conversar”, sino de hacer cosas: buscar información en la web, rellenar formularios, programar, gestionar archivos, consultar calendarios, e incluso tomar decisiones sobre qué hacer a continuación.
De Operator a Agent: una evolución anunciada

ChatGPT Agent
OpenAI ha ido sembrando las bases de esta transformación durante los últimos meses. Primero fue Operator, una función experimental que permitía a ChatGPT interactuar directamente con páginas web. Luego llegó Deep Research, enfocada en generar informes extensos y bien fundamentados a partir de múltiples fuentes.
Ambas funciones apuntaban hacia un mismo objetivo: romper la barrera entre la conversación y la acción. Lo que OpenAI ha presentado ahora con ChatGPT Agent unifica esos avances y los lleva mucho más lejos.
¿Cómo funciona ChatGPT Agent?
Durante la demostración oficial, se presentó un caso práctico: planear un viaje para asistir a una boda. Lo interesante no fue solo la tarea en sí, sino cómo la IA fue capaz de resolverla. El agente entendió el contexto, accedió a páginas web para buscar hoteles, tuvo en cuenta el clima del destino, propuso regalos, recordó que hacía falta un traje y recomendó tiendas cercanas para comprarlo. Todo, paso a paso, sin que el usuario tuviera que indicarle qué hacer en cada momento.
Y lo más llamativo: todo ocurrió dentro de ChatGPT. Sin necesidad de abrir nuevas pestañas, cambiar entre aplicaciones o copiar y pegar enlaces. El usuario simplemente describió el problema, y el agente se encargó del resto.
Un ordenador virtual para la IA
El secreto detrás de esta autonomía es el acceso a un ordenador virtual interno, donde la IA puede operar con múltiples herramientas integradas:
- Un navegador de texto para leer información rápidamente.
- Un navegador visual para interactuar con interfaces gráficas (botones, menús, formularios).
- Un terminal que le permite ejecutar comandos, escribir código o manipular archivos.
- Herramientas de productividad como hojas de cálculo, presentaciones y editores de texto.
- Acceso autorizado a servicios externos como Google Drive, Calendar o GitHub.
Esto permite que el agente actúe como lo haría un usuario humano avanzado, pero con la velocidad y precisión de una IA. No solo responde preguntas: cumple objetivos.
¿Qué hay detrás del modelo?
Aunque OpenAI no ha revelado el nombre oficial del modelo que impulsa ChatGPT Agent, sabemos que se trata de una arquitectura especialmente entrenada para tareas complejas que requieren orquestar múltiples herramientas y recursos. Este modelo ha sido entrenado usando aprendizaje por refuerzo, una técnica que permite a la IA aprender de sus decisiones y mejorar con el tiempo.
Este enfoque es similar al que OpenAI ya ha usado en sus modelos de razonamiento lógico, pero ahora se aplica a un entorno más interactivo, donde el agente debe elegir, por ejemplo, cuándo usar un navegador, cuándo ejecutar un comando, o cuándo consultar una API externa.
Como lo resumió Mark Chen, jefe de investigación de OpenAI:
“Cada vez es menos necesario tener un doctorado en IA para lograr cosas poderosas con inteligencia artificial.”
¿Quién puede usarlo y cómo?
Por ahora, ChatGPT Agent está disponible para los usuarios de los planes Pro, Plus y Team. Se puede activar fácilmente desde el menú de herramientas dentro de ChatGPT, o escribiendo el comando /agent en el cuadro de texto.
OpenAI ha confirmado que la función también llegará próximamente a los planes Enterprise y Education. Sin embargo, su despliegue en el Espacio Económico Europeo (EEE) está en pausa, debido a los desafíos regulatorios que ya han ralentizado otros lanzamientos en esa región.
Características clave de ChatGPT Agent
Autonomía en la acción. El agente elige herramientas por sí mismo: decide cuándo clicar, filtrar, programar, escribir código o llamar APIs, todo desde su “ordenador virtual”.
Flujo colaborativo. Puedes interrumpir, redirigir o reanudar tareas en cualquier momento. El agente también consulta detalles si necesita mayor precisión.
Control y seguridad. Antes de realizar pasos sensibles, pide confirmación. Además, rechaza acciones de riesgo y protege los datos del usuario durante la navegación.
Rendimiento SOTA (State of the Art). ChatGPT Agent marca récords en benchmarks como HLE, DSBench, SpreadsheetBench y WebArena, superando tanto a modelos anteriores como a humanos en tareas específicas.
Automatización repetible. Permite programar tareas recurrentes (por ejemplo, informes semanales) dentro del mismo chat, sin tener que reiniciar el flujo cada vez.
Privacidad robusta. Los datos del navegador remoto no se almacenan. Además, es posible eliminar cookies y sesiones con un solo clic.
Disponibilidad y límites. Se lanza de forma gradual en los planes Pro, Plus y Team. Pro tiene casi tareas ilimitadas; el resto cuenta con 50 tareas al mes. Los planes Enterprise y Education lo recibirán en julio.
Limitaciones actuales. Las funciones de presentaciones están en beta y aún en formato básico. OpenAI ya trabaja en mejoras de velocidad, profundidad contextual y estilo de respuesta.
¿Qué significa esto para el futuro?
El lanzamiento de ChatGPT Agent representa un cambio de paradigma. Por primera vez, un asistente conversacional basado en IA tiene la capacidad real de actuar en el mundo digital por sí solo. Esto transforma por completo la relación entre humanos y máquinas:
- Los usuarios ya no tienen que ser expertos en tecnología para realizar tareas complejas.
- Las empresas pueden delegar procesos operativos a agentes automatizados e inteligentes.
- La productividad personal puede alcanzar un nuevo nivel, con asistentes que organizan, deciden y ejecutan.
En muchos sentidos, estamos presenciando el nacimiento de los verdaderos agentes de IA, no como ciencia ficción, sino como una herramienta que puedes usar hoy mismo.
OpenAI ha redefinido lo que significa interactuar con una inteligencia artificial. ChatGPT Agent ya no es solo un chatbot, sino un asistente digital autónomo, capaz de operar como un ser humano en tareas cotidianas y profesionales. Y aunque todavía estamos en las primeras fases de esta revolución, una cosa está clara: el futuro del trabajo, la productividad y la tecnología está siendo rediseñado, y los agentes de IA serán protagonistas clave en esta nueva era.
Team Evolupedia