Maximize Productivity with AI Agents

Bookmark
Rate this content

En esta masterclass, exploraremos cómo delegar trabajo a modelos de lenguaje grandes y automatizar la mayor parte del "trabajo ocupado" para maximizar y mejorar la productividad a diario. Lo haremos principalmente explorando cómo los LLMs pueden llamar funciones.

This talk has been presented at Productivity Conf for Devs and Tech Leaders, check out the latest edition of this Tech Conference.

Tejas Kumar
Tejas Kumar
25 min
27 Mar, 2025

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Soy Tejas Kumar, un desarrollador de software con más de 20 años de experiencia. Los agentes de IA se definen como entidades que actúan en nombre de usuarios o grupos para producir efectos específicos. Los agentes constan de una capa de orquestación, un modelo de lenguaje y herramientas representadas como funciones JSON. Langflow es una herramienta de código abierto que permite a los usuarios construir sus propios agentes de IA conectando modelos de lenguaje y herramientas. Composio es una herramienta que mejora las capacidades de los agentes al ofrecer integraciones y aplicaciones, como la integración de Google Calendar. MCP (Modelo de Protocolo de Contexto) es una forma de compartir contexto con modelos y extender sus capacidades. Permite que las funciones estén disponibles para los modelos a través de entrada/salida estándar o un punto final HTTP. MCP se puede usar con GitHub para realizar varias tareas como buscar y corregir problemas de código. La masterclass cubrió los conceptos básicos de los agentes de IA, la construcción de agentes con Langflow y su mejora con Composio, y el uso de MCP con GitHub. El orador alentó preguntas de la audiencia y la exploración de estos conceptos.

1. Introducción a los Agentes de IA

Short description:

Soy Tejas Kumar, y he estado construyendo en la web durante más de 20 años en lugares como Brasel, Spotify, Zeta y más. Definamos qué es un agente. Un agente es alguien que actúa. Veamos otra definición llamada agencia. Estas palabras son importantes mientras discutimos sobre los agentes, porque son fundamentales para entender los agentes de IA. ¿Qué es un agente de IA? Es cuando una IA actúa en nombre de usted o de un grupo o toma un papel activo o produce un efecto específico. Los modelos de lenguaje grandes o redes neuronales simulan nuestros cerebros, nuestras redes neuronales. Si un cerebro humano tiene agencia para elegir herramientas, también lo tiene un modelo de lenguaje o un LLM. ¿Qué es la agencia? Es la capacidad de elegir una herramienta para lograr un resultado o producir un efecto particular. Ahora enfoquémonos en la definición de agencia en el contexto de los modelos de lenguaje.

Soy Tejas Kumar, y he estado construyendo en la web durante más de 20 años en lugares como Brasel, Spotify, Zeta y más. Y gran parte de esta construcción ha sido habilitada por agentes de IA. Este fue el gran tema de tendencia en 2025, agentes de IA. Así que en nuestro tiempo juntos hoy, hablemos sobre los agentes, y hablemos de ello asumiendo cero conocimiento, y partamos de ahí.

Para comenzar, definamos qué es un agente. Y para hacer eso, podemos simplemente ir a Google y escribir definir agente, ¿verdad? Y lo que vemos es que es una persona que actúa en nombre de otra persona o grupo, una persona o cosa que toma un papel activo y o produce un efecto específico. Y lo que podemos ver es que un agente es alguien que actúa. Eso es literalmente lo que es. Ya sea aquí en la primera definición, actúa en nombre o toma un papel activo. Veamos otra definición mientras estamos aquí llamada agencia. Y esto es interesante porque es un sustantivo, que es un negocio u organización que proporciona un servicio particular en nombre de otra persona como un agente de viajes o algo así. O la segunda, acción o intervención al producir un efecto particular. Y así, estas palabras son importantes mientras discutimos sobre los agentes, porque son fundamentales para entender los agentes de IA. Así que nota que dice un negocio o persona anteriormente. Y cuando tomamos estas definiciones y las aplicamos a la IA, obtenemos agentes de IA. Entonces, ¿qué es un agente de IA? Es cuando una IA actúa en nombre de usted o de un grupo o cuando una IA toma un papel activo o produce un efecto específico.

La agencia, si miramos esa otra definición, si miramos la agencia, dice un negocio o organización que proporciona un servicio particular, o esta, acción o intervención al producir un efecto particular. Canales tallados por la agencia del agua. Hay más definiciones aquí, en las que podemos profundizar en la etimología y todo esto. Pero una de las definiciones de agencia es también simplemente libre albedrío o libertad para elegir. Por ejemplo, si me pides que multiplique dos números primos muy grandes, podría, usando mi agencia, intentar hacerlo en mi cabeza, probablemente me equivoque, o usando mi agencia, elegir una herramienta para usar como la calculadora y hacerlo bien. Así que el uso de herramientas y elegir la herramienta es un principio de un agente, ya sea humano, IA o de otro modo o negocio. Y así, eso es como agente 101. ¿Qué significa esto para la IA? Básicamente lo mismo. Los modelos de lenguaje grandes o redes neuronales son algoritmos que simulan nuestros cerebros, nuestras redes neuronales. Son literalmente la representación de un cerebro humano. Así que si un cerebro humano tiene agencia para elegir herramientas, también lo tiene un modelo de lenguaje o un LLM, porque es en última instancia solo una red neuronal, una red neuronal basada en transformadores, si estás interesado. Y así, espero que eso quede claro. Entonces, ¿qué es la agencia? Es la capacidad de elegir una herramienta para lograr un resultado o, en el caso de esta diapositiva, producir un efecto particular. Ahora enfoquémonos en la definición de agencia en el contexto de los modelos de lenguaje.

2. Componentes de Agentes y Uso de Herramientas

Short description:

Hay un gran artículo de Google publicado en octubre de 2024, Agents, por Julia Wiesinger, Patrick Marlow y Vladimir Vuskovich. Esto, en última instancia, es un agente. Es un tiempo de ejecución que contiene tres componentes: una capa de orquestación, un modelo, generalmente un modelo de lenguaje, y herramientas. Las herramientas no son más que funciones. Los modelos de lenguaje pueden generar salida estructurada, que es JSON. Los modelos de lenguaje utilizan herramientas generando salida JSON. Por ejemplo, un modelo de lenguaje puede generar una herramienta llamada objeto JSON con argumentos como la ciudad. La aplicación que consume esta salida luego llamaría a la función correspondiente en la capa de orquestación.

Hay un gran artículo de Google publicado en octubre de 2024, Agents, por Julia Wiesinger, Patrick Marlow y Vladimir Vuskovich. Y este artículo continúa describiendo, disculpen, fue en septiembre de 2024. El artículo continúa describiendo qué es un agente. Y si vamos a esa sección, hay un texto y un diagrama. Esto, en última instancia, es un agente. Es un tiempo de ejecución que contiene tres componentes: una capa de orquestación donde las cosas están, bueno, orquestadas u organizadas, un modelo, generalmente un modelo de lenguaje y herramientas.

Creo que si hemos tenido alguna exposición a algo como chatGPT, sabemos qué es un modelo de lenguaje. No necesitamos entrar en detalles sobre eso. Pero hablemos sobre herramientas y luego la capa de orquestación. Las herramientas no son más que funciones. Así es como se representan en el paisaje de agentes de IA. Son funciones. Y así, algunos podrían pensar que un modelo de lenguaje puede llamar funciones. Eso no es cierto. Los modelos de lenguaje pueden generar salida estructurada. Porque, ¿qué es la salida estructurada? Es solo lenguaje. Es JSON. Y así, cómo los modelos de lenguaje utilizan herramientas es generando salida JSON.

Déjame mostrarte. Así que si venimos a TL draw y simplemente creamos nuestras diapositivas de manera interactiva, puedes decir, digamos que el usuario eres tú y dices obtener el clima al modelo de lenguaje. Un modelo de lenguaje puede entonces decir, no puedo, ¿verdad? Si no puede. O el modelo de lenguaje generará una herramienta llamada objeto JSON. Así que podría generarte algo como esto. El nombre de la herramienta es obtener clima. Y luego args es completo. Es un array de argumentos que se genera completamente. Y, por supuesto, args sería la ciudad, por ejemplo. Y luego tu aplicación que consume esta salida leería esto. Y luego en el código de la aplicación o en la capa de orquestación, harías esto. Llamarías a obtener clima con Berlín, ¿verdad? Y luego, sea cual sea la respuesta, volvería al LLM.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

IA y Desarrollo Web: ¿Exageración o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Exageración o Realidad?
Top Content
This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.
Despliegue Atómico para Hipsters de JavaScript
DevOps.js Conf 2024DevOps.js Conf 2024
25 min
Despliegue Atómico para Hipsters de JavaScript
This Talk discusses atomic deployment for JavaScript and TypeScript, focusing on automated deployment processes, Git hooks, and using hard links to copy changes. The speaker demonstrates setting up a bare repository, configuring deployment variables, and using the post-receive hook to push changes to production. They also cover environment setup, branch configuration, and the build process. The Talk concludes with tips on real use cases, webhooks, and wrapping the deployment process.
Pruebas de rendimiento efectivas para su servidor con Autocannon
TestJS Summit 2021TestJS Summit 2021
36 min
Pruebas de rendimiento efectivas para su servidor con Autocannon
Top Content
Tamar is an experienced code writer and architect with expertise in Node.js. Performance testing can be confusing, but understanding terms like throughput and the 99th percentile is crucial. The 99th percentile is important for making commitments and ensuring customer satisfaction. AutoCanon is a powerful tool for simulating requests and analyzing server performance. It can be installed globally or used as a library in Node.js. Autocannon is preferred over Gatling for performance testing and can be integrated with end-to-end tests in Cypress.
Olvida el mal código, concéntrate en el sistema
React Summit US 2023React Summit US 2023
27 min
Olvida el mal código, concéntrate en el sistema
Top Content
Setting up the system and separating concerns are important in software development. Modular construction and prefab units are a new trend that makes construction quicker and easier. Architectural complexity can lead to a drop in productivity and an increase in defects. Measuring architectural complexity can help identify natural modules in the code. Best practices for avoiding architectural complexity include organizing code by business domain and using prop drilling. Atomic design and organizing a monorepo are recommended approaches for managing architectural complexity.
Pruebas de integración encantadoras con Testcontainers
TestJS Summit 2022TestJS Summit 2022
21 min
Pruebas de integración encantadoras con Testcontainers
Top Content
Testing is crucial for development and production, with integration tests becoming more popular. Test containers is a library that integrates with Docker to create reliable test environments. It is flexible and can be used with various frameworks and test libraries. The IDE setup involves configuring the container and connecting it to the application. Test containers can be used for complex operations and allows running tests with real dependencies.
Confesiones de un Impostor
JSNation 2022JSNation 2022
46 min
Confesiones de un Impostor
Top Content
The Talk discusses imposter syndrome and reframes it as being a professional imposter. It emphasizes the importance of sharing and starting, embracing imposterism, and building inclusively for the web. The speaker shares personal experiences of being an imposter in various technical disciplines and highlights the significance of accessibility. The Talk concludes with the idea of building a collective RPG game to remove excuses for not making things accessible.

Workshops on related topic

Pruebas automatizadas de accesibilidad con jest-axe y Lighthouse CI
TestJS Summit 2021TestJS Summit 2021
85 min
Pruebas automatizadas de accesibilidad con jest-axe y Lighthouse CI
Workshop
Bonnie Schulkin
Bonnie Schulkin
¿Incluyen tus pruebas automatizadas verificaciones de accesibilidad? Este masterclass cubrirá cómo comenzar con jest-axe para detectar violaciones de accesibilidad basadas en código, y Lighthouse CI para validar la accesibilidad de las páginas completamente renderizadas. Ninguna cantidad de pruebas automatizadas puede reemplazar las pruebas manuales de accesibilidad, pero estas verificaciones se asegurarán de que tus probadores manuales no estén haciendo más trabajo del necesario.
Utilizando las Capacidades de IA Integradas de Zapier y las Integraciones de Herramientas de IA
Productivity Conf - Practical AI in MarketingProductivity Conf - Practical AI in Marketing
57 min
Utilizando las Capacidades de IA Integradas de Zapier y las Integraciones de Herramientas de IA
Workshop
Kelly Goss
Kelly Goss
Cómo potenciar tu construcción de automatización sin código y reducir el tiempo de construcción con las últimas características y funcionalidades de IA de Zapier. También cubriré herramientas de IA que se integran nativamente con Zapier para llevar la productividad a un nivel completamente nuevo.
Horario y ubicación de la masterclass: por determinar, remoto vía Zoom
Automatización de pruebas utilizando WebdriverIO
TestJS Summit 2022TestJS Summit 2022
163 min
Automatización de pruebas utilizando WebdriverIO
Workshop
Kevin Lamping
Kevin Lamping
En este masterclass, cubro no solo lo que WebdriverIO puede hacer, sino también cómo lo utilizarás día a día. He construido los ejercicios en torno a escenarios del mundo real que demuestran cómo realmente configurar las cosas. No es solo "qué hacer", sino específicamente "cómo llegar allí". Cubriremos los fundamentos de las pruebas automatizadas de UI para que puedas escribir pruebas mantenibles y útiles para tu sitio web y/o aplicación web.
JS Automatización de Pruebas de Seguridad para Desarrolladores en Cada Compilación
TestJS Summit 2021TestJS Summit 2021
111 min
JS Automatización de Pruebas de Seguridad para Desarrolladores en Cada Compilación
Workshop
Oliver Moradov
Bar Hofesh
2 authors
Como desarrollador, necesitas entregar rápido y simplemente no tienes tiempo para pensar constantemente en seguridad. Aún así, si algo sale mal, es tu trabajo arreglarlo, pero las pruebas de seguridad bloquean tu automatización, crean cuellos de botella y solo retrasan las versiones... pero no tiene por qué ser así...

El escáner de seguridad de NeuraLegion, enfocado en los desarrolladores, Dynamic Application Security Testing (DAST), permite a los desarrolladores detectar, priorizar y remediar problemas de seguridad de manera TEMPRANA, en cada confirmación, sin falsos positivos/alertas, sin ralentizarte.

¡Únete a esta masterclass para aprender diferentes formas en que los desarrolladores pueden acceder a Nexploit y comenzar a escanear sin salir de la terminal!

Recorreremos la configuración de principio a fin, mientras configuramos un pipeline, ejecutamos pruebas de seguridad y analizamos los resultados.

Tabla de contenidos:
- Qué es realmente DAST (Dynamic Application Security Testing) enfocado en los desarrolladores y cómo funciona
- Ver dónde y cómo encaja un DAST moderno y preciso en el CI/CD
- Integrar el escáner Nexploit de NeuraLegion con GitHub Actions
- Comprender cómo se pueden probar las aplicaciones modernas, las API y los mecanismos de autenticación
- Hacer un fork de un repositorio, configurar un pipeline, ejecutar pruebas de seguridad y analizar los resultados
Automatización de pruebas de seguridad para desarrolladores en cada compilación
GraphQL Galaxy 2021GraphQL Galaxy 2021
82 min
Automatización de pruebas de seguridad para desarrolladores en cada compilación
Workshop
Oliver Moradov
Bar Hofesh
2 authors
Como desarrollador, necesitas entregar rápido y simplemente no tienes tiempo para pensar constantemente en seguridad. Aún así, si algo sale mal, es tu trabajo arreglarlo, pero las pruebas de seguridad bloquean tu automatización, crean cuellos de botella y solo retrasan las versiones, especialmente con graphQL... pero no tiene por qué ser así...

El escáner de seguridad de NeuraLegion, enfocado en los desarrolladores, permite detectar, priorizar y remediar problemas de seguridad de manera temprana, en cada confirmación, sin falsos positivos o alertas, sin ralentizarte.

Únete a esta masterclass para aprender diferentes formas en las que los desarrolladores pueden acceder al escáner de seguridad de NeuraLegion y comenzar a escanear sin salir de la terminal!

Recorreremos la configuración de principio a fin, mientras configuramos un pipeline para un objetivo GraphQL vulnerable, ejecutamos pruebas de seguridad y analizamos los resultados.

Tabla de contenidos:
- Qué es realmente el escáner de seguridad de NeuraLegion enfocado en los desarrolladores (Dynamic Application Security Testing) y cómo funciona
- Ver dónde y cómo encaja un escáner moderno y preciso enfocado en los desarrolladores en el CI/CD
- Integrar el escáner de NeuraLegion con GitHub Actions
- Comprender cómo se pueden probar las aplicaciones modernas, GraphQL y otras API y mecanismos de autenticación
- Hacer un fork de un repositorio, configurar un pipeline, ejecutar pruebas de seguridad y analizar los resultados