Sub Agent Context Sharing: Cómo habilitar subagentes efectivos para codificación

Bookmark
Rate this content
 Zhou Jason
Zhou Jason
15 min
23 Oct, 2025

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Cloud Code introdujo la función de subagente para un mejor rendimiento. Comprender el concepto de subagente y su papel. Desafíos de los subagentes en la implementación directa. Visibilidad limitada de los agentes principales. Gestión eficiente del contexto con archivos MD para las tareas y reportes de los subagentes mejorando el rendimiento de Cloud Code. Directrices para crear subagentes útiles con herramientas MCP específicas. Utilización de TweakScene MCP para referencia de diseño de escenas y definición de reglas para tareas de subagentes. Establecimiento de objetivos, formato de salida y reglas para subagentes. Construcción de una réplica de chat GPT con chat.cn UI y Versatile AIS. Integración con VerCell AI SDK para una implementación sin problemas.

1. Understanding Cloud Code Sub-agent System

Short description:

Cloud Code introdujo la función de sub-agente para un mejor rendimiento. Comprender el concepto de sub-agente y su papel. Asignación de tareas para ahorrar tokens e ingeniería de contexto.

Entonces, Cloud Code introdujo su función de sub-agente hace unas semanas, y fue un concepto súper emocionante. Sin embargo, para las personas que lo prueban, a menudo tienen una experiencia bastante negativa, donde un sub-agente se siente lento, consume muchos más tokens y, lo más importante, no parece estar contribuyendo a un mejor resultado. Y yo estaba entre esas personas, pero solo recientemente comencé a aprender las mejores prácticas para usar sub-agentes. Y eso ha cambiado totalmente el juego y ha hecho que mi Cloud Code funcione mucho mejor de manera consistente.

Por eso quiero compartir cómo pienso y diseño el sistema de sub-agentes. Entonces, primero, tenemos que entender por qué Cloud Code introdujo inicialmente el concepto de sub-agente. Si no sabes exactamente cómo funciona el agente de Cloud Code detrás de escena, es básicamente una herramienta llamada agente que está equipada con una lista de diferentes herramientas para leer un archivo, listar todos los archivos, editar archivos, cosas así. Y algunas de las herramientas pueden consumir muchos más tokens como la herramienta de lectura, porque vas a incluir todo el contenido de un archivo en el historial de la conversación. Y antes de que Cloud Code tuviera la función de sub-agente, todo lo hacía el propio agente de Cloud Code.

Lo que significa que antes de comenzar a implementar, ya podría usar el 80% de la ventana de contexto, porque esos archivos contendrán una gran cantidad de contexto, lo que probablemente activará este comando de conversación compacta que resumirá toda la conversación antes de que puedas continuar. Y como sabemos, cada vez que compactas la conversación, el rendimiento cae dramáticamente porque comienza a perder contexto sobre lo que ha hecho antes. Por eso más tarde introdujeron esta herramienta de tareas para el agente de Cloud Code. Permite a Cloud Code asignar una tarea a otro agente. Y este agente tendrá exactamente el mismo conjunto de herramientas, incluyendo leer archivo, buscar archivo. Así que puedes activar este agente para que realmente escanee toda la base de código, entienda cuáles son todos los archivos relevantes para cambiar. Y luego, basado en esa información, hacer la implementación real. Y la forma en que se ahorran tokens es porque desde la perspectiva del agente principal, todos los pasos que el sub-agente toma en el medio no serán parte del historial de la conversación para el agente principal.

2. Challenges with Sub-agent Implementation

Short description:

El propósito del sub-agente para la ingeniería de contexto. Desafíos de los sub-agentes en la implementación directa. Intercambio de información limitado entre agentes para la resolución de problemas.

Entonces vemos que se asignó la tarea al sub-agente y luego el sub-agente regresa con un resumen del informe de investigación, que puede usarse para guiar la siguiente mejor acción. Al hacer eso, efectivamente conviertes ese consumo masivo de tokens de la acción de leer archivo, buscar archivo, en algo como un resumen de solo unos pocos cientos de tokens, pero que aún contiene la información más importante para guiar la siguiente acción. Así que todo el propósito del sub-agente ha sido en torno a la ingeniería de contexto y la optimización de contexto. Pero donde las cosas fallan es cuando las personas comienzan a intentar que un sub-agente no solo haga el trabajo de investigación, sino que también realice directamente la implementación.

Por ejemplo, el primer pensamiento que tuve fue ¿qué pasaría si pudiéramos tener un agente de desarrollo front-end para hacer solo una implementación front-end con reglas y flujos de trabajo especiales, así como un agente de desarrollo back-end que esté especializado en la implementación back-end. Entonces, para el agente principal, realmente solo orquesta toda la conversación y delega tareas a otros. Esto suena muy bien al principio, pero en el momento en que lo que sea que el sub-agente implemente no sea 100% correcto y quieras que el agente lo arregle, ahí es donde comienza el problema. Porque para cada agente, solo tiene información muy limitada sobre lo que está sucediendo. Para el agente de desarrollo front-end, solo conoce la acción que toma así como el mensaje final que genera en esa tarea específica.

Lo mismo para el agente de desarrollo back-end. Y si le indicas al agente de Cloud Code que hay un error en el front-end, aunque se asigne nuevamente al desarrollo front-end, esto solo desencadenará una nueva conversación, porque el agente de desarrollo front-end no sabría qué sucedió antes en la última sesión de front-end, y tampoco tendrá ningún contexto sobre lo que el desarrollo back-end ha hecho antes. Así que cada tarea es una sesión muy contenida. Mientras tanto, para el agente principal de Cloud Code, también tiene información muy limitada, porque nuevamente, no verá todas las acciones que se han tomado para el sub-agente, lo que significa que no sabrá qué archivos específicos se han creado y qué se ha puesto realmente en esos archivos.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Escalando Rápido – Lecciones de Ingeniería de ~15 Años de Startups Tecnológicas
React Advanced 2024React Advanced 2024
27 min
Escalando Rápido – Lecciones de Ingeniería de ~15 Años de Startups Tecnológicas
Hey, we'll discuss scaling fast and engineering lessons learned in the last 15 years of tech startups. Scaling involves three things: business, team, and tech. Business scalability relies on sales and customer acquisition costs. Engineering is a tool the business uses. Scaling the team is vital as tech problems are often people problems. Team structure affects architecture and product development process. Organize teams based on purpose, not technology. Spend less time being blocked by other teams. Ship features without getting blocked. Own your own mess. Focus on product engineering partnership. Build faster using feedback cycles. Build appropriate solutions for your use case. Let go of ego and experiment with different approaches. Engineers own their own mess. Avoid work in progress. Finish the work and focus on fixing it later. Have a conversation before writing code. Scaling the tech is easier than you think. Pick an off the shelf design. Save innovation for core parts. Pick existing solutions. Focus on solving the problem. Don't waste time trying to predict future scale. Scale will surprise you. Do what works for your business. Push back on unnecessary complexity. Understand the cost of ideas. Modify the situation to fit existing design. Architecture is like a dependency graph on your code. Reduce architectural complexity by organizing code based on what it does. Use vertical models and avoid creating excessive dependencies. On the client, use vertical modules. On the back end, consider a service-oriented architecture. Start with a monolith and transition to microservices if necessary. Use folders instead of microservices when you have a small team. Use vertical models and contract or type-driven development to define clear APIs and interfaces. Avoid highly interconnected code and duplication. Focus on data structures to avoid complexity and the need for translation layers. Building translation layers can lead to slow user experience. Vertical teams aligned with vertical code allow for fast problem-solving, full control of features, and efficient data handling. Understanding the entire domain enables faster development with fewer bugs.
Cómo automatizar cambios de código para 100 repositorios: Introducción a los Codemods
React Day Berlin 2022React Day Berlin 2022
28 min
Cómo automatizar cambios de código para 100 repositorios: Introducción a los Codemods
This Talk discusses automating code changes for Android repositories, utilizing tools like JSCodeShift and Abstract Syntax Tree. The speaker shares a real use case example of maintaining a design system library and making changes to a component. The talk emphasizes the importance of automating repetitive tasks and using the power of abstract syntax tree for code changes. The Q&A session covers topics like source code formatting, TypeScript support, and cultural embedding of code mods. The talk concludes with insights on when automation is worth it and the limitations of code mods for monorepo changes.
Arquitectura de código de próxima generación para construir aplicaciones de Node mantenibles
Node Congress 2023Node Congress 2023
30 min
Arquitectura de código de próxima generación para construir aplicaciones de Node mantenibles
Today's Talk focused on code architecture, modularization, and scaling in software development. The speaker discussed the benefits of separating code by domain and using tools like NX to improve productivity and enforce modular architecture. They also highlighted the importance of automating library creation and configuration. Additionally, the Talk covered code scaling and deployment strategies, including caching and automated code migrations. The speaker emphasized the flexibility and scalability of Fastify and the advantages of using a monorepo for front-end and back-end development.
Camino a Cero Fallos de Lint: Abordando Desafíos de Calidad de Código a Gran Escala
React Summit US 2023React Summit US 2023
11 min
Camino a Cero Fallos de Lint: Abordando Desafíos de Calidad de Código a Gran Escala
This Talk discusses the journey from thousands of Lint failures to zero in a codebase at Linton that is over 80 years old. The approach involved implementing rules, incentives, and tooling to address the issue. The tool called Checkup was used to visualize ESLint failures by team and lint rule, providing accountability and responsibility. The efforts resulted in cleaning up over 6,000 lint failures, with 55 contributors, and a 30% increase in perceived code quality.
El Futuro Stack de la Revisión de Código
JSNation 2023JSNation 2023
22 min
El Futuro Stack de la Revisión de Código
The Talk discusses the challenges of code reviews and the need to redefine the code review process in light of changes in software development. It emphasizes the importance of collaboration, security, performance, and clean code in the new stack of code review. The Talk also highlights the benefits of automating code review comments and optimizing the code review process. Overall, the Talk aims to build a better code review process that promotes collaboration and improves the quality of software development.
Acelerando la calidad del código con las métricas de DORA
JSNation Live 2021JSNation Live 2021
27 min
Acelerando la calidad del código con las métricas de DORA
This Talk discusses the Dora Metrics and their relation to continuous code improvement. High and elite performers deploy more frequently and have a lower change failure rate. Continuous code improvement involves identifying and fixing bugs in real time. Rollbar is a continuous code improvement platform that provides visibility into actionable errors. It helps organizations reduce the risk of losing customers and optimize developer productivity. Rollbar's unique error fingerprints and advanced features enable a deeper understanding of issues and faster resolution.

Workshops on related topic

Desarrollando Aplicaciones Listas para Producción en Colaboración con Agentes de AI
React Summit 2025React Summit 2025
102 min
Desarrollando Aplicaciones Listas para Producción en Colaboración con Agentes de AI
Featured Workshop
Alex Shershebnev
Alex Shershebnev
Los asistentes de codificación ya están cambiando la forma en que desarrollamos código, y en varios años se espera que cambien completamente cómo los desarrolladores interactúan con el código y lo escriben. En esta masterclass, compartiré consejos y mejores prácticas sobre el uso de tales herramientas mientras desarrollamos la aplicación lista para producción con Zencoder.
Aporta Calidad y Seguridad al pipeline de CI/CD
DevOps.js Conf 2022DevOps.js Conf 2022
76 min
Aporta Calidad y Seguridad al pipeline de CI/CD
Workshop
Elena Vilchik
Elena Vilchik
En esta masterclass repasaremos todos los aspectos y etapas al integrar tu proyecto en el ecosistema de Calidad y Seguridad del Código. Tomaremos una aplicación web simple como punto de partida y crearemos un pipeline de CI que active el monitoreo de calidad del código. Realizaremos un ciclo completo de desarrollo, comenzando desde la codificación en el IDE y abriendo una Pull Request, y te mostraré cómo puedes controlar la calidad en esas etapas. Al final de la masterclass, estarás listo para habilitar esta integración en tus propios proyectos.