¿Qué es realmente un agente en Inteligencia Artificial y por qué importa?

¿Qué es realmente un agente en Inteligencia Artificial y por qué importa?

A menudo, los ingenieros de IA hablamos de ‘agentes’ asumiendo que todos comprenden el concepto. Sin embargo, esa no siempre es la realidad. Incluso he visto que muchas personas utilizan la palabra «agente» porque suena a tecnología de vanguardia, pero sin tener del todo claro su significado. “Agentes conversacionales”, por ejemplo, es un término muy popular, aunque pocos realmente entienden lo que implica.

Hoy quiero explicar qué es un agente en IA desde mi propia experiencia, no con una definición típica de internet.

¿Qué NO es un agente en IA?

Para entender bien qué es un agente, me gusta empezar con anti-ejemplos. De esta forma podemos entender tanto lo que es como lo que no es.

Volvamos un par de años atrás, a noviembre de 2020, cuando ChatGPT se hizo oficial con el modelo GPT-3.5. Si lo recuerdas, en aquella primera versión podíamos hacer preguntas y recibir respuestas. No había acceso a internet, ni razonamientos avanzados, ni capacidades para ejecutar acciones. Era simplemente una interacción de pregunta y respuesta (con algo de contexto del historial de la conversación). ¿Eso era un agente de IA? No.

¿Por qué no? Porque no tomaba decisiones, no interactuaba con su entorno; solo generaba una respuesta basada en probabilidades. Era un modelo predictivo que calculaba, dada una secuencia de palabras, cuáles eran las más probables a continuación. Simplemente era un modelo de lenguaje, no un agente.

Lamentablemente, ya quedan pocos ejemplos de aplicaciones que no sean agentes, porque la tendencia es construir agentes cada vez más sofisticados. Un ejemplo de una aplicación que no es un agente podría ser un chatbot simple que solo responde con respuestas predefinidas, sin acceso a información externa ni capacidad de razonamiento.

¿Qué SÍ es un agente en IA?

Ahora, si abres ChatGPT, verás que los modelos tienen acceso a internet, pueden generar y probar código, e incluso tienen memoria más allá del simple historial de la conversación. Todo esto transforma a ChatGPT de un simple modelo de lenguaje a un agente. ¿Por qué? Porque ahora tiene capacidades de razonamiento, puede tomar decisiones y actuar según el contexto, lo cual significa que puede analizar la situación y elegir entre diferentes acciones, en lugar de limitarse a generar una respuesta sin comprensión del entorno. Tiene un comportamiento mucho más cercano al de un ser humano.

En resumen, mi definición de un agente en Inteligencia Artificial es: «un modelo de lenguaje que ejecuta una serie de acciones, teniendo en cuenta su entorno, para alcanzar un determinado objetivo».

El entorno puede incluir bases de datos, páginas web, o conexiones a APIs a las que el modelo puede acceder mediante herramientas. El objetivo puede ser algo tan sencillo como proporcionar información al usuario (por ejemplo, dar un insight de una base de datos, responder preguntas sobre un producto, o verificar el estado de una empresa en la bolsa) hasta algo más complejo como coordinar múltiples tareas de automatización, interactuar con varios sistemas para completar un proceso de negocio, o incluso planificar y ejecutar una estrategia a partir de datos en tiempo real.

¿Y ahora qué?

Aquí te dejo la pregunta abierta: ¿qué tipo de agentes estás viendo en el mundo real que estén haciendo cosas sorprendentes? Estoy seguro de que el futuro traerá agentes aún más complejos, y podríamos discutir ejemplos reales en los comentarios. ¿Te animas?

Deja un comentario

Comentarios

Aún no hay comentarios. ¿Por qué no comienzas el debate?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *