Desconstruyendo el Rastreo Distribuido

Rate this content
Bookmark
Slides

El rastreo distribuido es una técnica poderosa que te permite seguir el flujo y el tiempo de las solicitudes a medida que navegan a través de un sistema. Al vincular operaciones y solicitudes entre múltiples servicios, el rastreo distribuido proporciona valiosos conocimientos sobre el rendimiento de la aplicación y ayuda a identificar cuellos de botella. En esta charla, Lazar explicará el concepto de Rastreo Distribuido guiándote a través de cómo las herramientas de monitoreo construyen soluciones de rastreo.

This talk has been presented at React Day Berlin 2023, check out the latest edition of this React Conference.

FAQ

La trazabilidad distribuida es una técnica que permite rastrear el flujo y el tiempo de las solicitudes y operaciones a través de un sistema, especialmente útil en aplicaciones de microservicios y pilas completas para entender el rendimiento del sistema e identificar cuellos de botella.

Es importante porque ayuda a comprender el rendimiento del sistema y a identificar problemas complejos y cuellos de botella, facilitando la depuración de errores inusuales y condiciones de carrera que no se podrían identificar fácilmente con métodos de depuración más simples.

Inicialmente, se utilizaban registros simples en servidores como Apache. Con el tiempo, la concurrencia y la asincronía en las aplicaciones requirieron métodos más complejos, como el uso de IDs únicos para solicitudes y, finalmente, la implementación de microservicios y contenedores intensificó la necesidad de herramientas más avanzadas como la trazabilidad distribuida.

Un 'span' es la unidad más pequeña de trabajo en la trazabilidad distribuida, como una solicitud HTTP o una llamada a función, que puede iniciar otros 'spans' hijos, creando una jerarquía que refleja la estructura del software y ayuda a identificar el flujo y rendimiento de operaciones específicas dentro del sistema.

Se utiliza un contexto de traza que concatena el ID de la traza y el ID del último 'span' en una cadena. Esta cadena se transfiere entre clientes, microservicios y otras unidades de procesamiento, permitiendo que el sistema continúe la traza a partir del último 'span' donde se quedó.

Además de mejorar la depuración y el rendimiento del sistema, la trazabilidad distribuida permite mantener etiquetas y un estado en cada 'span', lo que facilita la búsqueda, agrupación y análisis detallado de datos para optimizar aún más las operaciones y detectar ineficiencias.

Lazar Nikolov
Lazar Nikolov
8 min
12 Dec, 2023

Comments

Sign in or register to post your comment.
Video Summary and Transcription
El rastreo distribuido es una técnica poderosa para rastrear solicitudes y operaciones en un sistema, especialmente en aplicaciones de pila completa y microservicios. La reinvención del rastreo distribuido introduce el concepto de un rastro y abarca para capturar datos de depuración. Las mejoras incluyen etiquetas y un campo de estado para un mejor análisis, y la distribución de rastros utilizando un contexto de rastro para un rastreo continuo.

1. Introducción a la Trazabilidad Distribuida

Short description:

La trazabilidad distribuida es una técnica poderosa que ayuda a rastrear el flujo y el tiempo de las solicitudes y operaciones en un sistema. Es especialmente útil para aplicaciones de pila completa y microservicios, permitiendo una mejor comprensión del rendimiento del sistema e identificación de cuellos de botella. La técnica ha estado presente desde principios de los años 2000 pero ganó popularidad en la década de 2010. A medida que las bibliotecas y los marcos evolucionaron, también lo hicieron las herramientas de depuración, desde los registros en Apache Server hasta el manejo de múltiples solicitudes en un solo proceso con hilos separados. Con la concurrencia avanzada, marcos como Node.js permiten que las solicitudes comiencen y terminen en diferentes hilos.

♪ ♪ Reconstruyendo la trazabilidad distribuida. Hola a todos. Mi nombre es Laza Nikolov, y soy un defensor del desarrollo en Sentry. Hoy en mi charla, vamos a hablar sobre la trazabilidad distribuida. Primero explicaré qué es. Luego vamos a entrar un poco en la historia de las herramientas de depuración para descubrir por qué existía la trazabilidad distribuida en primer lugar. Y luego, para entenderlo mejor, vamos a reconstruir la trazabilidad distribuida desde cero o al menos solo el concepto de ella.

Muy bien, entonces, sumerjámonos. La trazabilidad distribuida es una técnica poderosa que te permite rastrear el flujo y el tiempo de las solicitudes y operaciones a medida que fluyen a través de tu sistema. Esto es especialmente útil para la pila completa y para las aplicaciones de microservicios. La trazabilidad distribuida te ayuda a entender el rendimiento del sistema e identificar cualquier cuello de botella. Es especialmente útil para depurar errores complejos y extraños como los errores de condición de carrera que requieren mucho más que solo un bloqueo de consola y un rastreo de pila. No es nuevo por ningún medio. Hay documentos técnicos que mencionan la trazabilidad desde principios de los años 2000, pero se popularizó durante la década de 2010. Entonces, para entender por qué existe, necesitamos retroceder en el tiempo.

A medida que nuestras bibliotecas y marcos evolucionaron, también lo hicieron nuestras herramientas de depuración. Por ejemplo, en los primeros días de Apache Server, los registros eran uno de los pocos métodos para depurar. A medida que llegaban las solicitudes, Apache generaba un proceso hijo y manejaba las solicitudes. Si querías depurar lo que sucedió durante esa solicitud específica, podrías simplemente extraer los registros del proceso y verás todo el flujo de operación. Y eso funcionó. Estábamos contentos. Luego obtuvimos concurrencia básica. Piensa en IIS en ASP.NET. En lugar de generar un proceso para cada solicitud, comenzamos a manejar múltiples solicitudes en un solo proceso, pero en un hilo separado. Los registros siguen siendo un buen método de depuración, pero para aislar los registros de la solicitud, necesitamos prefijarlos con el nombre del hilo y luego filtrar los mensajes de registro basándonos en él. No es gran cosa, pero lo hicimos funcionar. Luego obtuvimos concurrencia avanzada. Nuestros marcos evolucionaron a ser asíncronos, multihilos, futuros y promesas, marcos basados en bucles de eventos. Esto es Node.js. Así que ahora nuestra solicitud puede comenzar en un hilo, pero terminar en uno diferente, pasando por muchos otros hilos en el camino.

2. Reinventando la Trazabilidad Distribuida

Short description:

El prefijo de los registros con un ID único para cada solicitud ya no resuelve el problema en un sistema distribuido. Con el auge de los servicios contenerizados, los backends se distribuyen en varias máquinas, lo que dificulta el seguimiento de las operaciones. Para abordar esto, reinventamos la trazabilidad distribuida desde cero. Introdujimos el concepto de una traza, que sigue una solicitud y captura datos de depuración. Dentro de la traza, tenemos spans que representan la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función. Los spans pueden crear spans hijos, lo que nos permite reflejar la estructura de nuestro software. Cada span tiene un ID único y contiene datos como su ID padre.

Prefijarlos con el nombre del hilo realmente no resuelve nuestro problema ahora. Necesitamos prefijarlos con algo único para la solicitud en sí, y eso es lo que hicimos. Generamos un ID único para cada solicitud y lo prefijamos, nuestros registros.

Pero nuestros frameworks no dejaron de evolucionar. Hace unos 10 años, Docker y AWS dieron paso a los servicios contenerizados. Y ahora nuestros backends ni siquiera viven en una sola máquina. Cada contenedor y microservicio manejaba múltiples solicitudes y producía sus propios registros. Nuestros registros están por todas partes ahora. Era muy difícil entender el flujo de operaciones, por lo que necesitábamos una mejor herramienta de depuración que pudiera rastrear las operaciones a medida que saltan entre containers y servicios. Ahí es cuando la trazabilidad distribuida se convirtió en una herramienta necesaria para la depuración.

Para entender cómo funciona, vamos a reinventarlo desde cero. Dado que nuestros backends ahora tienen una naturaleza muy distribuida, necesitábamos definir un vehículo para cada solicitud que la seguirá y capturará los data de depuración en el camino. Llamemos a eso una traza. La traza comenzará cuando comience el flujo de operaciones, y va a tener un ID único. Eso puede ser el frontend, por ejemplo.

Si pensamos en los registros, generalmente nos dicen qué sucedió en un momento particular. Intentan imitar la estructura de nuestro código. Así que inventemos eso ahora. Inventemos algo que vaya a describir la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función o cualquier cosa específica que nuestro software haga en un momento específico. Vamos a llamar a eso un span, y vamos a crear uno inmediatamente cuando comience la traza. Eso va a ser nuestro span raíz.

Así que al igual que los registros, los spans van a imitar la estructura de nuestro software. Pero como lo estamos reinventando, hagámoslo mucho más inteligente que simples mensajes. Entonces, como los spans son la unidad más pequeña de trabajo, como una sola función, y sabemos que una función puede invocar a otra función, que a su vez también puede invocar a una tercera función, vamos a design nuestros spans para que puedan crear spans hijos, que pueden crear sus propios spans hijos y así sucesivamente. Ahora realmente podemos reflejar la estructura de nuestro software con esto. Tenemos una jerarquía de spans, pero necesitamos recordar qué span es hijo de qué span. Para hacer eso, vamos a necesitar algo para identificar cada span. Así que asignaremos un ID a cada span a medida que los creamos. También necesitamos guardar el ID del span padre. Así que vamos a crear un espacio dentro de cada span para que pueda contener data como su ID y su ID padre.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Una Guía del Comportamiento de Renderizado de React
React Advanced 2022React Advanced 2022
25 min
Una Guía del Comportamiento de Renderizado de React
Top Content
This transcription provides a brief guide to React rendering behavior. It explains the process of rendering, comparing new and old elements, and the importance of pure rendering without side effects. It also covers topics such as batching and double rendering, optimizing rendering and using context and Redux in React. Overall, it offers valuable insights for developers looking to understand and optimize React rendering.
Acelerando tu aplicación React con menos JavaScript
React Summit 2023React Summit 2023
32 min
Acelerando tu aplicación React con menos JavaScript
Top Content
Mishko, the creator of Angular and AngularJS, discusses the challenges of website performance and JavaScript hydration. He explains the differences between client-side and server-side rendering and introduces Quik as a solution for efficient component hydration. Mishko demonstrates examples of state management and intercommunication using Quik. He highlights the performance benefits of using Quik with React and emphasizes the importance of reducing JavaScript size for better performance. Finally, he mentions the use of QUIC in both MPA and SPA applications for improved startup performance.
Concurrencia en React, Explicada
React Summit 2023React Summit 2023
23 min
Concurrencia en React, Explicada
Top Content
React 18's concurrent rendering, specifically the useTransition hook, optimizes app performance by allowing non-urgent updates to be processed without freezing the UI. However, there are drawbacks such as longer processing time for non-urgent updates and increased CPU usage. The useTransition hook works similarly to throttling or bouncing, making it useful for addressing performance issues caused by multiple small components. Libraries like React Query may require the use of alternative APIs to handle urgent and non-urgent updates effectively.
El Futuro de las Herramientas de Rendimiento
JSNation 2022JSNation 2022
21 min
El Futuro de las Herramientas de Rendimiento
Top Content
Today's Talk discusses the future of performance tooling, focusing on user-centric, actionable, and contextual approaches. The introduction highlights Adi Osmani's expertise in performance tools and his passion for DevTools features. The Talk explores the integration of user flows into DevTools and Lighthouse, enabling performance measurement and optimization. It also showcases the import/export feature for user flows and the collaboration potential with Lighthouse. The Talk further delves into the use of flows with other tools like web page test and Cypress, offering cross-browser testing capabilities. The actionable aspect emphasizes the importance of metrics like Interaction to Next Paint and Total Blocking Time, as well as the improvements in Lighthouse and performance debugging tools. Lastly, the Talk emphasizes the iterative nature of performance improvement and the user-centric, actionable, and contextual future of performance tooling.
How React Compiler Performs on Real Code
React Advanced 2024React Advanced 2024
31 min
How React Compiler Performs on Real Code
Top Content
I'm Nadia, a developer experienced in performance, re-renders, and React. The React team released the React compiler, which eliminates the need for memoization. The compiler optimizes code by automatically memoizing components, props, and hook dependencies. It shows promise in managing changing references and improving performance. Real app testing and synthetic examples have been used to evaluate its effectiveness. The impact on initial load performance is minimal, but further investigation is needed for interactions performance. The React query library simplifies data fetching and caching. The compiler has limitations and may not catch every re-render, especially with external libraries. Enabling the compiler can improve performance but manual memorization is still necessary for optimal results. There are risks of overreliance and messy code, but the compiler can be used file by file or folder by folder with thorough testing. Practice makes incredible cats. Thank you, Nadia!
Optimización de juegos HTML5: 10 años de aprendizaje
JS GameDev Summit 2022JS GameDev Summit 2022
33 min
Optimización de juegos HTML5: 10 años de aprendizaje
Top Content
PlayCanvas is an open-source game engine used by game developers worldwide. Optimization is crucial for HTML5 games, focusing on load times and frame rate. Texture and mesh optimization can significantly reduce download sizes. GLTF and GLB formats offer smaller file sizes and faster parsing times. Compressing game resources and using efficient file formats can improve load times. Framerate optimization and resolution scaling are important for better performance. Managing draw calls and using batching techniques can optimize performance. Browser DevTools, such as Chrome and Firefox, are useful for debugging and profiling. Detecting device performance and optimizing based on specific devices can improve game performance. Apple is making progress with WebGPU implementation. HTML5 games can be shipped to the App Store using Cordova.

Workshops on related topic

Masterclass de Depuración de Rendimiento de React
React Summit 2023React Summit 2023
170 min
Masterclass de Depuración de Rendimiento de React
Top Content
Featured WorkshopFree
Ivan Akulov
Ivan Akulov
Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Vería una interacción lenta, intentaría una optimización aleatoria, vería que no ayudaba, y seguiría intentando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Haría una grabación en Chrome DevTools o React Profiler, la examinaría, intentaría hacer clic en cosas aleatorias, y luego la cerraría frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos a analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, estaremos cubriendo el rendimiento de la interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)
Construyendo aplicaciones web que iluminan Internet con QwikCity
JSNation 2023JSNation 2023
170 min
Construyendo aplicaciones web que iluminan Internet con QwikCity
Featured WorkshopFree
Miško Hevery
Miško Hevery
Construir aplicaciones web instantáneas a gran escala ha sido elusivo. Los sitios del mundo real necesitan seguimiento, análisis y interfaces y interacciones de usuario complejas. Siempre comenzamos con las mejores intenciones pero terminamos con un sitio menos que ideal.
QwikCity es un nuevo meta-framework que te permite construir aplicaciones a gran escala con un rendimiento de inicio constante. Veremos cómo construir una aplicación QwikCity y qué la hace única. El masterclass te mostrará cómo configurar un proyecto QwikCity. Cómo funciona el enrutamiento con el diseño. La aplicación de demostración obtendrá datos y los presentará al usuario en un formulario editable. Y finalmente, cómo se puede utilizar la autenticación. Todas las partes básicas para cualquier aplicación a gran escala.
En el camino, también veremos qué hace que Qwik sea único y cómo la capacidad de reanudación permite un rendimiento de inicio constante sin importar la complejidad de la aplicación.
Next.js 13: Estrategias de Obtención de Datos
React Day Berlin 2022React Day Berlin 2022
53 min
Next.js 13: Estrategias de Obtención de Datos
Top Content
WorkshopFree
Alice De Mauro
Alice De Mauro
- Introducción- Prerrequisitos para la masterclass- Estrategias de obtención: fundamentos- Estrategias de obtención – práctica: API de obtención, caché (estática VS dinámica), revalidar, suspense (obtención de datos en paralelo)- Prueba tu construcción y sírvela en Vercel- Futuro: Componentes de servidor VS Componentes de cliente- Huevo de pascua de la masterclass (no relacionado con el tema, destacando la accesibilidad)- Conclusión
Depuración del Rendimiento de React
React Advanced 2023React Advanced 2023
148 min
Depuración del Rendimiento de React
Workshop
Ivan Akulov
Ivan Akulov
Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Veía una interacción lenta, probaba una optimización aleatoria, veía que no ayudaba, y seguía probando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Hacía una grabación en Chrome DevTools o React Profiler, la examinaba, intentaba hacer clic en cosas al azar, y luego la cerraba frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos cómo analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, cubriremos el rendimiento de interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)
Masterclass de alto rendimiento Next.js
React Summit 2022React Summit 2022
50 min
Masterclass de alto rendimiento Next.js
Workshop
Michele Riva
Michele Riva
Next.js es un marco convincente que facilita muchas tareas al proporcionar muchas soluciones listas para usar. Pero tan pronto como nuestra aplicación necesita escalar, es esencial mantener un alto rendimiento sin comprometer el mantenimiento y los costos del servidor. En este masterclass, veremos cómo analizar el rendimiento de Next.js, el uso de recursos, cómo escalarlo y cómo tomar las decisiones correctas al escribir la arquitectura de la aplicación.
Maximizar el rendimiento de la aplicación optimizando las fuentes web
Vue.js London 2023Vue.js London 2023
49 min
Maximizar el rendimiento de la aplicación optimizando las fuentes web
WorkshopFree
Lazar Nikolov
Lazar Nikolov
Acabas de llegar a una página web y tratas de hacer clic en un elemento en particular, pero justo antes de hacerlo, se carga un anuncio encima y terminas haciendo clic en eso en su lugar.
Eso... eso es un cambio de diseño. Todos, tanto los desarrolladores como los usuarios, saben que los cambios de diseño son malos. Y cuanto más tarde ocurran, más interrupciones causarán a los usuarios. En este masterclass vamos a analizar cómo las fuentes web causan cambios de diseño y explorar algunas estrategias para cargar fuentes web sin causar grandes cambios de diseño.
Tabla de contenidos:¿Qué es CLS y cómo se calcula?¿Cómo las fuentes pueden causar CLS?Estrategias de carga de fuentes para minimizar CLSRecapitulación y conclusión